天天看點

Linux iconv使用

iconv [選項】檔案

輸入/輸出格式規範:

-f,

--from-code=名稱 原始文本編碼

-t, --to-code=名稱

輸出編碼

資訊:

-l, --list

列舉所有已知的字元集

輸出控制:

-c

從輸出中忽略無效的字元

-o, --output=file 輸出檔案

-s, --silent

關閉警告

--verbose

列印進度資訊

是以,我在程式的末尾直接加了一句

iconv -f utf-8 -t

gb2312 /server_test/reports/software_.txt >

/server_test/reports/software_asserts.txt

解決了問題。

在網上查了些資料還知道在linux上進行編碼轉換時,還可以利用iconv函數族程式設計實作。

/*以下内容摘自[url]http://www.xrss.cn/info/10425.html[/url]*/

iconv函數族的頭檔案是iconv.h,使用前需包含之。

#include

<iconv.h>

iconv函數族有三個函數,原型如下:

(1) iconv_t

iconv_open(const char *tocode, const char

*fromcode);

此函數說明将要進行哪兩種編碼的轉換,tocode是目标編碼,fromcode是原編碼,該函數傳回一個轉換句柄,供以下兩個函數使用。

(2)

size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t

*outbytesleft);

此函數從inbuf中讀取字元,轉換後輸出到outbuf中,inbytesleft用以記錄還未轉換的字元數,outbytesleft用以記錄輸出緩沖的剩餘空間。

(3) int iconv_close(iconv_t

cd);

此函數用于關閉轉換句柄,釋放資源。

例子1:

用c語言實作的轉換示例程式

/* f.c : 代碼轉換示例c程式 */

#define outlen

255

main()

{

char *in_utf8 =

"姝e?ㄥ??瑁?";

char *in_gb2312 = "正在安裝";

char

out[outlen];

//unicode碼轉為gb2312碼

rc =

u2g(in_utf8,strlen(in_utf8),out,outlen);

printf("unicode-->gb2312

out=%sn",out);

//gb2312碼轉為unicode碼

g2u(in_gb2312,strlen(in_gb2312),out,outlen);

printf("gb2312-->unicode

}

//代碼轉換:從一種編碼轉為另一種編碼

int

code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char

*outbuf,int outlen)

iconv_t

cd;

int rc;

char **pin =

&inbuf;

char **pout = &outbuf;

cd =

iconv_open(to_charset,from_charset);

if (cd==0) return

-1;

memset(outbuf,0,outlen);

if

(iconv(cd,pin,&inlen,pout,&outlen)==-1) return

iconv_close(cd);

return

0;

u2g(char *inbuf,int inlen,char *outbuf,int

outlen)

code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);

g2u(char *inbuf,size_t inlen,char *outbuf,size_t

code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);

例子2:

用c++語言實作的轉換示例程式

/* f.cpp : 代碼轉換示例c++程式

*/

#include <iconv.h>

<iostream>

using namespace std;

//

代碼轉換操作類

class codeconverter

private:

public:

構造

codeconverter(const char *from_charset,const char

*to_charset) {

析構

~codeconverter()

轉換輸出

int convert(char *inbuf,int inlen,char *outbuf,int outlen)

char **pin = &inbuf;

char **pout =

&outbuf;

iconv(cd,pin,(size_t *)&inlen,pout,(size_t

*)&outlen);

};

main(int argc, char **argv)

utf-8-->gb2312

codeconverter cc =

codeconverter("utf-8","gb2312");

cc.convert(in_utf8,strlen(in_utf8),out,outlen);

cout

<< "utf-8-->gb2312 in=" << in_utf8 << ",out=" << out

<< endl;

gb2312-->utf-8

codeconverter cc2 =

codeconverter("gb2312","utf-8");

cc2.convert(in_gb2312,strlen(in_gb2312),out,outlen);

<< "gb2312-->utf-8 in=" << in_gb2312 << ",out=" <<

out << endl;

繼續閱讀