天天看點

前端必知詞彙:GB 2312

GB 2312編碼是指,資訊交換用漢字編碼字元集。《資訊交換用漢字編碼字元集》是由中國國家标準總局1980年釋出,1981年5月1日開始實施的一套國家标準,标準号是GB 2312—1980。GB2312編碼适用于漢字處理、漢字通信等系統之間的資訊交換,通行于中國大陸,新加坡等地也采用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援GB 2312。

GB 2312标準共收錄了6763個漢字,其中一級漢字3755個,二級漢字3008個。同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西裡爾字母在内的682個全角字元。

在使用GB2312的程式中,通常采用EUC儲存方法,以便相容于ASCII。浏覽器編碼表上的“GB2312”,通常都是指“EUC-CN”表示法。

GB 2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆寫中國大陸99.75%的使用頻率。但對于人名、古漢語等方面出現的罕用字,GB 2312不能處理,這也導緻了後來GBK及GB 18030漢字字元集的出現。

資料來源:

[1] 《資訊交換用漢字編碼字元集·第二輔助集》

[2] 《資訊交換用漢字編碼字元集·第四輔助集》