GBK全稱《漢字内碼擴充規範》(GBK即“國标”、“擴充”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國資訊技術标準化技術委員會1995年12月1日制訂,國家技術監督局标準化司、電子工業部科技與品質監督司1995年12月15日聯合以技監标函1995 229号檔案的形式,将它确定為技術規範指導性檔案。這一版的GBK規範為1.0版。
GBK編碼是在GB2312-80标準基礎上的内碼擴充規範,使用了雙位元組編碼方案,其編碼範圍從8140至FEFE(剔除xx7F),共23940個碼位,共收錄了21003個漢字,完全相容GB2312-80标準,支援國際标準ISO/IEC10646-1和國家标準GB13000-1中的全部中日韓漢字,并包含了BIG5編碼中的所有漢字。
GBK采用單雙位元組變長編碼,英文使用單位元組編碼,完全相容ASCII字元編碼,中文部分采用雙位元組編碼。GBK規範收錄了 ISO 10646.1 中的全部 CJK 漢字和符号,并有所補充。GBK總體編碼範圍為 8140-FEFE,首位元組在 81-FE 之間,尾位元組在 40-FE 之間,剔除 xx7F 一條線。總計 23940 個碼位,共收入 21886 個漢字和圖形符号,其中漢字(包括部首和構件)21003 個,圖形符号 883 個。
資料來源:
林甯, 毛永剛. 漢字内碼擴充規範——漢字編碼的又一發展[J]. 電子标準化與品質, 1996(2):15-17.
呂肖慶. 超大字庫輸入法的實作[J]. 微型電腦應用, 2001(02).