最近在學習爬蟲,但是關于解碼和編碼的問題上出現了一些問題,百度了一下,終于找到了問題的解決辦法
爬取網頁時,自己用的明明是utf-8的編碼(第一行的注釋為utf-8,編碼中的編碼格式也是utf-8),但是還是報gbk的錯誤,找了半天發現不是編碼的問題,而是print的問題,因為pycharm自帶的編碼是gbk的,而輸出的utf-8,難免就會出錯了,是以要将預設的編碼格式改為utf-8的
隻需要進行如下設定:
①在file中選擇settings
②然後再editor下的file encoding中,将兩個編碼格式均設定為utf-8的形式即可
補充:設定預設子產品注釋(第一行的代碼注釋不用一直輸入,每次建立檔案自動寫入)