天天看點

看過來,帶大家十分鐘了解Unicode,ASCII,UTF-8

作者:嵌入式xff

接着上一篇内容接着講述,大家持續關注小編,不要錯過精彩内容,文章的開頭還是老規矩,為了回應粉絲跟我要資料,小編整理一下分享給大家,計算機的火熱,帶來了大量的高薪就業崗位,大家一定要選對學習線路哦!加微信領取資料。

看過來,帶大家十分鐘了解Unicode,ASCII,UTF-8

接着上一篇的内容繼續講述,與ASCII字元串中的字元數相同,但世界上其他非西文的字元呢?

例如中文有超過1W個字元,更不用說其他書寫系統。如:阿拉伯文、西裡爾文、梵文等,經過無數次曲折的委員會建議和疊代,建立了Unicode标準,包括了一百多多種語言的十幾萬個獨特字元,來處理大量的語言。涵蓋很多複雜事物,像重音符,表情符号,修飾符号和其他奇怪的符号。Unicode比ASCII複雜很多,為了說清楚Unicode,我們不會說太多的術語。

看過來,帶大家十分鐘了解Unicode,ASCII,UTF-8

首先不用字元會模棱兩可,我們用‘字位/字素’,有意義的書寫書寫符号機關。像'd'或者‘你’,把他們看成拼字牌上的内容,單詞不是字位,因為它可以拆分成字母,用字位來表示Unicode。一種是用“代碼點”,組合成一個字位,例如'd'和'你'都可以由字碼點表示,像這個更複雜的字位,

看過來,帶大家十分鐘了解Unicode,ASCII,UTF-8

可以表示成如上所示代碼點,或者原始e加如上所示,修改前一個代碼點,增加音标,注意我們還沒說這些字母的二進制編碼問題。我們剛說了如何将圖形映射到一個或多個代碼點上,每個都有個數值,這裡是我們說的一些表情圖形以及代碼點對應Unicode的名字和值。

一旦我們有代碼點清單,各個都有應對的數字值,下一步就是找出如何将它們轉成對應的二進制,名為編碼。下一篇内容接着講述。