天天看點

Unicode CJK部分編碼筆記

首先請關注 http://zh.wikibooks.org/wiki/Unicode 直覺對照,下面是範圍的解釋

他的應用就不說了,基礎設施呀。

本來要帶上例子字元的,可ITEYE發不上,沒辦法了。

全部Unicode中日韓越通用漢字字元(約76227字)。

定義            範圍                   字數

CJK基本集    [4E00-9FBB]      20924字

                   [9FC3-9FCB]              8字

CJK擴充A     [3400-4DB5]       6582字

CJK擴充B     [20000-2A6D6] 42711字

CJK擴充C   [2A700-2B734]   4149字

CJK擴充D   [2A740-2B81D]     222字

部首擴充      [2E80-2EF3]        115字

康熙部首      [2F00-2FD5]        214字

IDS符号       [2FF0-2FFB]          12字

CJK符号      [3000-303F]          64字

日文假名      [3040-30FF]        189字

CJK注音符号 [3105-312C]         40字

CJK筆畫       [31C0-31E3]         36字

全角符号      [FF01-FF60]           96字

CJK相容        [F900-FAD9]        474字

CJK相容擴充  [2F800-2FA1D]    542字

PUA(GBK) [E815-E864]          79字

更詳細的解釋,其實有些是保留的,目的不外乎擴容準備

中日韓字元範圍2E80~9FFF

2E80~33FFh:中日韓符号區。收容康熙字典部首、中日韓輔助部首、注音符号、日本假名、韓文音符,中日韓的符号、标點、帶圈或帶括符文數字、月份,以及日本的假名組合、機關、年号、月份、日期、時間等。

3400~4DFFh:中日韓認同表意文字擴充A區,總計收容6,582個中日韓漢字。

4E00~9FFFh:中日韓認同表意文字區,總計收容20,902個中日韓漢字。

A000~A4FFh:彜族文字區,收容中國南方彜族文字和字根。

AC00~D7FFh:韓文拼音組合字區,收容以韓文音符拼成的文字。

F900~FAFFh:中日韓相容表意文字區,總計收容302個中日韓漢字。

FB00~FFFDh:文字表現形式區,收容組合拉丁文字、希伯來文、阿拉伯文、中日韓直式标點、小符号、半角符号、全角符号等。

對應官方文檔

标準CJK文字

http://www.unicode.org/Public/UNIDATA/Unihan.html

全角ASCII、全角中英文标點、半寬片假名、半寬平假名、半寬韓文字母:FF00-FFEF

http://www.unicode.org/charts/PDF/UFF00.pdf

CJK部首補充:2E80-2EFF

http://www.unicode.org/charts/PDF/U2E80.pdf

CJK标點符号:3000-303F

http://www.unicode.org/charts/PDF/U3000.pdf

CJK筆劃:31C0-31EF

http://www.unicode.org/charts/PDF/U31C0.pdf

康熙部首:2F00-2FDF

http://www.unicode.org/charts/PDF/U2F00.pdf

漢字結構描述字元:2FF0-2FFF

http://www.unicode.org/charts/PDF/U2FF0.pdf

注音符号:3100-312F

http://www.unicode.org/charts/PDF/U3100.pdf

注音符号(閩南語、客家語擴充):31A0-31BF

http://www.unicode.org/charts/PDF/U31A0.pdf

日文平假名:3040-309F

http://www.unicode.org/charts/PDF/U3040.pdf

日文片假名:30A0-30FF

http://www.unicode.org/charts/PDF/U30A0.pdf

日文片假名拼音擴充:31F0-31FF

http://www.unicode.org/charts/PDF/U31F0.pdf

韓文拼音:AC00-D7AF

http://www.unicode.org/charts/PDF/UAC00.pdf

韓文字母:1100-11FF

http://www.unicode.org/charts/PDF/U1100.pdf

韓文相容字母:3130-318F

http://www.unicode.org/charts/PDF/U3130.pdf

太玄經符号:1D300-1D35F

http://www.unicode.org/charts/PDF/U1D300.pdf

易經六十四卦象:4DC0-4DFF

http://www.unicode.org/charts/PDF/U4DC0.pdf

彜文音節:A000-A48F

http://www.unicode.org/charts/PDF/UA000.pdf

彜文部首:A490-A4CF

http://www.unicode.org/charts/PDF/UA490.pdf

盲文符号:2800-28FF

http://www.unicode.org/charts/PDF/U2800.pdf

CJK字母及月份:3200-32FF

http://www.unicode.org/charts/PDF/U3200.pdf

CJK特殊符号(日期合并):3300-33FF

http://www.unicode.org/charts/PDF/U3300.pdf

裝飾符号(非CJK專用):2700-27BF

http://www.unicode.org/charts/PDF/U2700.pdf

雜項符号(非CJK專用):2600-26FF

http://www.unicode.org/charts/PDF/U2600.pdf

中文豎排标點:FE10-FE1F

http://www.unicode.org/charts/PDF/UFE10.pdf

CJK相容符号(豎排變體、下劃線、頓号):FE30-FE4F

http://www.unicode.org/charts/PDF/UFE30.pdf