天天看點

ubuntu12.04 ThundBird導入csv檔案與亂碼問題,gedit亂碼問題

一、Ubuntu12.04 ThundBird導入csv檔案與亂碼問題

系統環境:ubuntu12.04

面向人群:有一點點程式設計基礎的讀者

相關軟體:ThunderBird, Emacs

問題描述:對于windows下由outlock導出的csv檔案,用雷鳥直接導入時會出現中文亂碼

解決方案:1.  下載下傳來的CSV檔案打開如圖所示

ubuntu12.04 ThundBird導入csv檔案與亂碼問題,gedit亂碼問題

                    2.  用Emacs打開(Emacs一般會自動轉碼)          

                   3. 全選内容,然後點選Copy按鈕

ubuntu12.04 ThundBird導入csv檔案與亂碼問題,gedit亂碼問題

             4. 建立一個空白文本文檔,将内容複制進去

關鍵 一步:将中間的逗号再增加加三個(注意是英文逗号),如

                    息,[email protected]                ----->          息,,,,[email protected]

                  是以如果對于大批量的資料,對于開發人員來說,寫一段小代碼可以很快實作這個功能

ubuntu12.04 ThundBird導入csv檔案與亂碼問題,gedit亂碼問題

         6. 然後thunderbird導入通訊錄,會看到

ubuntu12.04 ThundBird導入csv檔案與亂碼問題,gedit亂碼問題

                     知道為什麼要用 四個逗号 了吧?就是要讓email處在“主要電子郵件”一欄的位置上

          7. OK,Finish!

二、關于gedit顯示亂碼問題

ubuntu下漢字是以UTF-8為編碼的,但實際許多來自Windows的檔案編碼都是GB*(GB18030 GBK GB2312),許多時候變成了亂碼,

另外,GB2312相對字庫小一點。

總結了網上幾種方法:

1、用gedit打開一個編碼為GBK的文檔,儲存的時候,選擇對應的字元編碼

2、在終端輸入dconf-editor來配置gedit的字元編碼

->org->gnome->gedit->preference->encodings修改auto-detected為['GB2312', 'UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']

show in Menu['GB2312', 'GBK', 'ISO-8859-12']

以上最好将UTF-8放在最開始的地方,表示gedit預設選擇UTF8編碼格式來儲存資料。

3、不少人經過上述設定gedit就正常了,但是也有情況gedit還是在顯示亂碼,可能是系統不支援GB18030,添加

GB18030支援的方法如下:

sudo vim /var/lib/locales/supported.d/zh_hans

加入以下配置參數:

zh_CN.GB18030 GB18030

zh_CN.GBK GBK

zh_CN.GB2312 GB2312

zh_HK.BIG5 BIG5

zh_TW.BIG5 BIG5

然後執行 sudo locale-gen

提示以下資訊,成功了(可能比較慢,耐心等待)

zh_CN.GB18030… done

zh_CN.GBK… done

……

4、vim /etc/environment