天天看点

ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

一、Ubuntu12.04 ThundBird导入csv文件与乱码问题

系统环境:ubuntu12.04

面向人群:有一点点编程基础的读者

相关软件:ThunderBird, Emacs

问题描述:对于windows下由outlock导出的csv文件,用雷鸟直接导入时会出现中文乱码

解决方案:1.  下载来的CSV文件打开如图所示

ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

                    2.  用Emacs打开(Emacs一般会自动转码)          

                   3. 全选内容,然后点击Copy按钮

ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

             4. 新建一个空白文本文档,将内容复制进去

关键 一步:将中间的逗号再增加加三个(注意是英文逗号),如

                    息,[email protected]                ----->          息,,,,[email protected]

                  所以如果对于大批量的数据,对于开发人员来说,写一段小代码可以很快实现这个功能

ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

         6. 然后thunderbird导入通讯录,会看到

ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

                     知道为什么要用 四个逗号 了吧?就是要让email处在“主要电子邮件”一栏的位置上

          7. OK,Finish!

二、关于gedit显示乱码问题

ubuntu下汉字是以UTF-8为编码的,但实际许多来自Windows的文件编码都是GB*(GB18030 GBK GB2312),许多时候变成了乱码,

另外,GB2312相对字库小一点。

总结了网上几种方法:

1、用gedit打开一个编码为GBK的文档,保存的时候,选择对应的字符编码

2、在终端输入dconf-editor来配置gedit的字符编码

->org->gnome->gedit->preference->encodings修改auto-detected为['GB2312', 'UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']

show in Menu['GB2312', 'GBK', 'ISO-8859-12']

以上最好将UTF-8放在最开始的地方,表示gedit默认选择UTF8编码格式来保存数据。

3、不少人经过上述设置gedit就正常了,但是也有情况gedit还是在显示乱码,可能是系统不支持GB18030,添加

GB18030支持的方法如下:

sudo vim /var/lib/locales/supported.d/zh_hans

加入以下配置参数:

zh_CN.GB18030 GB18030

zh_CN.GBK GBK

zh_CN.GB2312 GB2312

zh_HK.BIG5 BIG5

zh_TW.BIG5 BIG5

然后执行 sudo locale-gen

提示以下信息,成功了(可能比较慢,耐心等待)

zh_CN.GB18030… done

zh_CN.GBK… done

……

4、vim /etc/environment