python中的字元串編碼問題——3.各作業系統下的不同編碼方式

2023-05-12 11:25:46

各作業系統下的不同編碼方式

先看一下

linux,python2.7

>>> B = b'\xc3\x84\xc3\xa8'

>>> B.decode('utf-8')

u'\xc4\xe8'

>>> type(B)

>>>

windows,python2.7,python shell

>>> B = b'\xc3\x84\xc3\xa8'

>>> B.decode('utf-8')

u'\xc4\xe8'

>>> print B.decode('utf-8')

Äè

>>>

windows,python2.7,python cmd控制台

>>> B = b'\xc3\x84\xc3\xa8'

>>> B.decode('utf-8')

u'\xc4\xe8'

>>> print B.decode('utf-8')

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

UnicodeEncodeError: 'gbk' codec can't encode character u'\xc4' in position 0: il

legal multibyte sequence

>>>

三種環境下不同輸出的原因：

windows控制台預設采用GBK編碼，liunx預設采用UTF-8編碼

------------------------------------------------------

檢視linux預設編碼：

[[email protected] ~]# env |grep LANG

LANG=zh_CN.UTF-8

------------------------------------------------------

檢視windows控制台預設編碼：

cmd打開控制台---->屬性---->檢視編碼為936（簡體中文GBK）

（進一步在linux和windows下建立文本檔案檢視編碼方式果然沒錯，證明。）

轉載于:https://www.cnblogs.com/Micang/p/9733028.html

python中的字元串編碼問題——3.各作業系統下的不同編碼方式

繼續閱讀

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

Linxu常用指令技巧彙總

27. Remove Element(清單)題目代碼

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

ACS基本配置-權限等級管理

傳說FreeBSD等比Linux更穩定，更“健壯”

無人機--飛控科普

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入