天天看點

UTF-8_百度百科

UTF-8_百度百科

優缺點

UTF-8編碼的優點:

UTF-8編碼可以通過屏蔽位和移位操作快速讀寫。字元串比較時strcmp()和wcscmp()的傳回結果相同,是以使排序變得更加容易。位元組FF和FE在UTF-8編碼中永遠不會出現,是以他們可以用來表明UTF-16或UTF-32文本(見BOM) UTF-8 是位元組順序無關的。它的位元組順序在所有系統中都是一樣的,是以它實際上并不需要BOM。

UTF-8編碼的缺點:

你無法從UNICODE字元數判斷出UTF-8文本的位元組數,因為UTF-8是一種變長編碼它需要用2個位元組編碼那些用擴充ASCII字元集隻需1個位元組的字元 ISO Latin-1 是UNICODE的子集,但不是UTF-8的子集 8位字元的UTF-8編碼會被email網關過濾,因為internet資訊最初設計為7位ASCII碼。是以産生了UTF-7編碼。 UTF-8 在它的表示中使用值100xxxxx的幾率超過50%, 而現存的實作如ISO 2022, 4873, 6429, 和8859系統,會把它錯認為是C1 控制碼。是以産生了UTF-7.5編碼。