天天看點

字元編碼

latin1

latin1是iso-8859-1的别名,有些環境下寫作latin-1。

iso-8859-1編碼是單位元組編碼,向下相容ascii,其編碼範圍是0x00-0xff,0x00-0x7f之間完全和ascii一緻,0x80-0x9f之間是控制字元,0xa0-0xff之間是文字元号。

iso-8859-1收錄的字元除ascii收錄的字元外,還包括西歐語言、希臘語、泰語、阿拉伯語、希伯來語對應的文字元号。歐元符号出現的比較晚,沒有被收錄在iso-8859-1當中。

因為iso-8859-1編碼範圍使用了單位元組内的所有空間,在支援iso-8859-1的系統中傳輸和存儲其他任何編碼的位元組流都不會被抛棄。換言之,把其他任何編碼的位元組流當作iso-8859-1編碼看待都沒有問題。這是個很重要的特性,mysql資料庫預設編碼是latin1就是利用了這個特性。ascii編碼是一個7位的容器,iso-8859-1編碼是一個8位的容器。