UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc0 in position 0: invalid start byte報錯解決

2022-11-09 15:14:56

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc0 in position 0: invalid start byte報錯解決

這個錯誤一看錯誤類型是編碼錯誤，

這句話翻譯過來就是“UnicodeDecodeError:“utf-8”編解碼器無法解碼位置0中的位元組0xca:無效的連續位元組”。說明啥呢？簡單簡單一句話就是你的文本裡帶的字元有utf-8翻譯不了的，utf-8中沒有定義。

如果你是讀取檔案就要在讀取的檔案裡面加encoding編碼格式

上面錯誤是utf-8格式沒有定義，

就加這個格式

encoding='utf-8'

如果你在讀取檔案的時候，産生的時候，例如下面加編碼格式

data = pd.read_csv(datafile,encoding = 'utf-8')

如果上面不行，用下面的

我們國家漢字采用的編碼方式是"gb2312",一般都是表頭帶漢字引起的，更改為如下代碼就好了。

data = pd.read_csv(datafile,encoding = 'gb2312')

上面的通過encoding = ''修改的方法可以在爬蟲中爬取資料運作這個編碼問題的時候

去打開要爬取的網頁的源代碼去檢視網頁的編碼格式

後面在這個裡面給寫上對于的編碼格式。

如果你在測試其他代碼遇到這個編碼問題

還有一種可能的原因就是，你的電腦是中文的昵稱

和pycharm裡面的全局編碼格式沖突了，識别不來編碼格式

這個時候你隻需要把電腦的中文昵稱改為一個全英文的昵稱就可以

重新打開pycahrm測試代碼運作，

這個時候你會發現代碼運作是沒有問題的，成功解決