python字元編碼

2017-11-15 23:50:00

python字元編碼

最早的字元編碼标準：ASCII

127個字元，沒有中文

1個英文字母需要1個位元組

8個位=1位元組

1024位元組=1kb

1024kb=1MB

後來為了擴充中文支援，出現了GB2312、GBK後來出現Unicode

把所有語言統一到一套編碼裡

每個字元占用2個位元組

最後出現UTF-8 （unicode的壓縮和優化）

1個英文 1個位元組

1個中文 3個位元組

python3.X 預設unicode編碼，預設支援中文

python3.X 輸入英文用的ASCII編碼，占用1個位元組。

python3.X 輸入中文用UTF-8編碼，占用3個位元組。

python2.X 預設ASCII編碼，無法支援中文

支援中文方式：

#!/bin/bash/env python #解釋器

#_*_ coding:utf-8 _*_ #支援中文，用utf-8格式編碼中文。

encode 編碼

decode 解碼

python3.X socket傳輸資料必須是二進制才能傳輸。

b開頭是二進制bytes類型。

轉換舉例：

msg = "你好"

print(msg.encode(encoding="utf-8")) 括号裡不指定編碼，預設使用utf-8編碼

print(msg.encode(encoding="utf-8").decode(encoding="utf-8"))

python2.X會以系統預設編碼進行編碼

本文轉自506554897 51CTO部落格，原文連結：http://blog.51cto.com/506554897/1906358，如需轉載請自行聯系原作者

python字元編碼

繼續閱讀

libsvm for python 安裝

拒絕使用者登入:/bin/false和/usr/sbin/nologin

學習軟體測試基礎測試第七天

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

Linxu常用指令技巧彙總

27. Remove Element(清單)題目代碼

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

ACS基本配置-權限等級管理

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入