一、Ubuntu12.04 ThundBird導入csv檔案與亂碼問題
系統環境:ubuntu12.04
面向人群:有一點點程式設計基礎的讀者
相關軟體:ThunderBird, Emacs
問題描述:對于windows下由outlock導出的csv檔案,用雷鳥直接導入時會出現中文亂碼
解決方案:1. 下載下傳來的CSV檔案打開如圖所示

2. 用Emacs打開(Emacs一般會自動轉碼)
3. 全選内容,然後點選Copy按鈕
4. 建立一個空白文本文檔,将内容複制進去
關鍵 一步:将中間的逗号再增加加三個(注意是英文逗号),如
息,[email protected] -----> 息,,,,[email protected]
是以如果對于大批量的資料,對于開發人員來說,寫一段小代碼可以很快實作這個功能
6. 然後thunderbird導入通訊錄,會看到
知道為什麼要用 四個逗号 了吧?就是要讓email處在“主要電子郵件”一欄的位置上
7. OK,Finish!
二、關于gedit顯示亂碼問題
ubuntu下漢字是以UTF-8為編碼的,但實際許多來自Windows的檔案編碼都是GB*(GB18030 GBK GB2312),許多時候變成了亂碼,
另外,GB2312相對字庫小一點。
總結了網上幾種方法:
1、用gedit打開一個編碼為GBK的文檔,儲存的時候,選擇對應的字元編碼
2、在終端輸入dconf-editor來配置gedit的字元編碼
->org->gnome->gedit->preference->encodings修改auto-detected為['GB2312', 'UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']
show in Menu['GB2312', 'GBK', 'ISO-8859-12']
以上最好将UTF-8放在最開始的地方,表示gedit預設選擇UTF8編碼格式來儲存資料。
3、不少人經過上述設定gedit就正常了,但是也有情況gedit還是在顯示亂碼,可能是系統不支援GB18030,添加
GB18030支援的方法如下:
sudo vim /var/lib/locales/supported.d/zh_hans
加入以下配置參數:
zh_CN.GB18030 GB18030
zh_CN.GBK GBK
zh_CN.GB2312 GB2312
zh_HK.BIG5 BIG5
zh_TW.BIG5 BIG5
然後執行 sudo locale-gen
提示以下資訊,成功了(可能比較慢,耐心等待)
zh_CN.GB18030… done
zh_CN.GBK… done
……
4、vim /etc/environment