天天看點

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc0 in position 0: invalid start byte報錯解決

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc0 in position 0: invalid start byte報錯解決

這個錯誤一看錯誤類型是編碼錯誤,

這句話翻譯過來就是“UnicodeDecodeError:“utf-8”編解碼器無法解碼位置0中的位元組0xca:無效的連續位元組”。說明啥呢?簡單簡單一句話就是你的文本裡帶的字元有utf-8翻譯不了的,utf-8中沒有定義。

如果你是讀取檔案就要在讀取的檔案裡面加encoding編碼格式

上面錯誤是utf-8格式沒有定義,

就加這個格式

encoding='utf-8'      

如果你在讀取檔案的時候,産生的時候,例如下面加編碼格式

data = pd.read_csv(datafile,encoding = 'utf-8')      

如果上面不行,用下面的

我們國家漢字采用的編碼方式是"gb2312",一般都是表頭帶漢字引起的,更改為如下代碼就好了。

data = pd.read_csv(datafile,encoding = 'gb2312')      

上面的通過encoding = ''修改的方法可以在爬蟲中爬取資料運作這個編碼問題的時候

去打開要爬取的網頁的源代碼去檢視網頁的編碼格式

後面在這個裡面給寫上對于的編碼格式。

如果你在測試其他代碼遇到這個編碼問題

還有一種可能的原因就是,你的電腦是中文的昵稱

和pycharm裡面的全局編碼格式沖突了,識别不來編碼格式

這個時候你隻需要把電腦的中文昵稱改為一個全英文的昵稱就可以

重新打開pycahrm測試代碼運作,

這個時候你會發現代碼運作是沒有問題的,成功解決