天天看點

Python檔案讀取編碼錯誤問題解決之(PyCharm開發工具預設設定的坑。。。)

剛接觸Python學習,正準備做個爬蟲的例子,誰知道代碼一開始就遇到了一個大坑,狂汗啊。

問題是這樣的:我通過代碼爬取了部落格園首頁的HTML代碼并存入到blog.txt檔案當中,然後準備讀取出來之後進行分析,可就在讀取檔案的這一步出現了問題。

執行讀取代碼的時候程式總是會抛一個叫 “UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 117274: illegal multibyte sequence”的異常。

剛開始以為是簡單的編碼問題,又是在代碼中設定編碼格式,又是百度谷歌的。可是,沒找到一個靠譜的解決方案,問題依然存在。

折騰了好幾天實在是沒辦法了,後來突然想到會不會和IDE的設定有關系(我使用的IDE是PyCharm)。呵呵,折騰一番還真的解決了。

錯誤截圖:

Python檔案讀取編碼錯誤問題解決之(PyCharm開發工具預設設定的坑。。。)

步驟一:打開IDE的設定選項

Python檔案讀取編碼錯誤問題解決之(PyCharm開發工具預設設定的坑。。。)

步驟二 檢視編碼設定,并将所有設定都設定為UTF-8

Python檔案讀取編碼錯誤問題解決之(PyCharm開發工具預設設定的坑。。。)

步驟三 編碼設定完後重新執行代碼,問題解決

Python檔案讀取編碼錯誤問題解決之(PyCharm開發工具預設設定的坑。。。)