今天測試一個漢字字元串長度,發現一個70個漢字(連同标點算上)strlen()得出結果是206,百思不得其解,然後搜網上資料才知道,給大家分享下
1. utf-8
如果系統采用的是utf-8,那麼strlen(“新聞”)=6,即一個漢字占用3個位元組。linux系統預設情況下采用的該種編碼方式。
2. gb2312
如果系統采用的是gb2312,則strlen(“新聞”)=4,即一個漢字占用2個位元組。windows中文版采用的該種編碼方式。
今天測試一個漢字字元串長度,發現一個70個漢字(連同标點算上)strlen()得出結果是206,百思不得其解,然後搜網上資料才知道,給大家分享下
1. utf-8
如果系統采用的是utf-8,那麼strlen(“新聞”)=6,即一個漢字占用3個位元組。linux系統預設情況下采用的該種編碼方式。
2. gb2312
如果系統采用的是gb2312,則strlen(“新聞”)=4,即一個漢字占用2個位元組。windows中文版采用的該種編碼方式。