一、現象
通過資料分析軟體處理後的資料(檔案是csv格式編碼是utf8) ,到了Python處理(這裡用的是python2)後竟然亂碼了,具體表現就是漢字亂碼,用csv打開後無法顯示正常的漢字,然後csv串位。
二、分析
1.亂碼首先我想到的就是格式可能存在問題。
2.spss導出來的資料為utf8.
3.windows 預設EXCEL用ANSI編碼編碼。
三、解決方案
思路:既然是編碼格式不一緻,那麼首先就應該解決格式問題。
1.現将csv用記事本打開(右鍵檔案,選擇打開方式),然後選擇儲存字元ANSI(左上角檔案,然後另存為選擇編碼為ansi)。
2.做python轉換的時候一定要保證所有檔案的格式一緻,不然做一些資料處理操作的時候,還是亂碼。