天天看點

78、iconv簡單使用

1、如果需要在Linux中操作windows下的檔案,那麼可能會經常遇到檔案編碼轉換的問題。Windows中預設的檔案格式是GBK(gb2312),而Linux一般都是UTF-8。

2、在Vim中可以檢視檔案編碼

:set fileencoding

    解決用Vim檢視檔案亂碼的問題,在

~/.vimrc中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

3、檔案編碼轉換

1)在Vim中直接進行轉換檔案編碼,如将一個檔案轉換成utf-8格式

:set fileencoding=utf-8

2)enconv 轉換檔案編碼,如要将一個GBK編碼的檔案轉換成UTF-8編碼:

enconv -L zh_CN -x UTF-8 filename

3)iconv轉換,iconv的指令格式如下:

iconv -f encoding -t encoding inputfile

如将一個UTF-8 編碼的檔案轉換成GBK編碼

iconv -f UTF-8 -t GBK file1 -o file2

4、iconv選項

① -c 從輸出中忽略無效的字元

② -o, --output=FILE 輸出檔案

③ -f, --from-code=名稱 原始文本編碼

④ -t, --to-code=名稱 輸出編碼

⑤ -l, --list 列舉所有已知的字元集

⑥ --usage 給出簡要的用法資訊

5、批量轉換[4]

    假設目前目錄下有foo1.txt foo2.txt .... foon.txt都是GB2312内碼,将他們全部專程BIG5内碼,并在後面加上BIG5作為字尾。建立一個腳本gb2312_2_big5.sh,内容如下:

ls *.txt |while read i

do iconv -f GB2312 -t BIG5 $i>$i.big5

done

儲存之後執行

sh gb2312_2_big5.sh

繼續閱讀