天天看點

處理資料spss亂碼一、現象二、分析三、解決方案

一、現象

通過資料分析軟體處理後的資料(檔案是csv格式編碼是utf8) ,到了Python處理(這裡用的是python2)後竟然亂碼了,具體表現就是漢字亂碼,用csv打開後無法顯示正常的漢字,然後csv串位。

二、分析

1.亂碼首先我想到的就是格式可能存在問題。

2.spss導出來的資料為utf8.

3.windows 預設EXCEL用ANSI編碼編碼。

三、解決方案

思路:既然是編碼格式不一緻,那麼首先就應該解決格式問題。

1.現将csv用記事本打開(右鍵檔案,選擇打開方式),然後選擇儲存字元ANSI(左上角檔案,然後另存為選擇編碼為ansi)。

處理資料spss亂碼一、現象二、分析三、解決方案

2.做python轉換的時候一定要保證所有檔案的格式一緻,不然做一些資料處理操作的時候,還是亂碼。