我們工作常常要在 Python 中導出 CSV 檔案,這些輸出的 CSV檔案,有些時候遇到特殊字元什麼的就會變成亂碼,如何處理呢?我們可以試試Pandas,Pandas是一個強大的分析結構化資料的工具集;它的使用基礎是Numpy(提供高性能的矩陣運算);用于資料挖掘和資料分析,同時也提供資料清洗功能,而DataFrame是Pandas中的一個表格型的資料結構,包含有一組有序的列,每列可以是不同的值類型(數值、字元串、布爾型等),DataFrame即有行索引也有列索引,可以被看做是由Series組成的字典,上一個簡單的代碼:
import pandas as pdlist = [ { 'name': '張三', 'age': 29, 'address': '北京~~)))**' }, { 'name': '李四', 'age': 18, 'address': '上海!#[email protected]#[email protected]#' }, { 'name': '王五', 'age': 60, 'address': '深圳*%##%@[email protected]#[email protected]' }]df = pd.DataFrame(list)df.to_csv('test.csv', index=False, encoding='utf-8-sig')
檢視結果:

讀取操作:
with open('test.csv',encoding='utf-8-sig') as f: reader=csv.DictReader(f) for row in reader: print(row)
輸出如下:
{'name': '張三', 'age': '29', 'address': '北京~~)))**'}{'name': '李四❤', 'age': '18', 'address': '上海!#[email protected]#[email protected]#'}{'name': '王五', 'age': '60', 'address': '深圳*%##%@[email protected]#[email protected]'}
碼字不易,喜歡就點個?~