天天看点

Linux iconv使用

iconv [选项】文件

输入/输出格式规范:

-f,

--from-code=名称 原始文本编码

-t, --to-code=名称

输出编码

信息:

-l, --list

列举所有已知的字符集

输出控制:

-c

从输出中忽略无效的字符

-o, --output=file 输出文件

-s, --silent

关闭警告

--verbose

打印进度信息

所以,我在程序的末尾直接加了一句

iconv -f utf-8 -t

gb2312 /server_test/reports/software_.txt >

/server_test/reports/software_asserts.txt

解决了问题。

在网上查了些资料还知道在linux上进行编码转换时,还可以利用iconv函数族编程实现。

/*以下内容摘自[url]http://www.xrss.cn/info/10425.html[/url]*/

iconv函数族的头文件是iconv.h,使用前需包含之。

#include

<iconv.h>

iconv函数族有三个函数,原型如下:

(1) iconv_t

iconv_open(const char *tocode, const char

*fromcode);

此函数说明将要进行哪两种编码的转换,tocode是目标编码,fromcode是原编码,该函数返回一个转换句柄,供以下两个函数使用。

(2)

size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t

*outbytesleft);

此函数从inbuf中读取字符,转换后输出到outbuf中,inbytesleft用以记录还未转换的字符数,outbytesleft用以记录输出缓冲的剩余空间。

(3) int iconv_close(iconv_t

cd);

此函数用于关闭转换句柄,释放资源。

例子1:

用c语言实现的转换示例程序

/* f.c : 代码转换示例c程序 */

#define outlen

255

main()

{

char *in_utf8 =

"姝e?ㄥ??瑁?";

char *in_gb2312 = "正在安装";

char

out[outlen];

//unicode码转为gb2312码

rc =

u2g(in_utf8,strlen(in_utf8),out,outlen);

printf("unicode-->gb2312

out=%sn",out);

//gb2312码转为unicode码

g2u(in_gb2312,strlen(in_gb2312),out,outlen);

printf("gb2312-->unicode

}

//代码转换:从一种编码转为另一种编码

int

code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char

*outbuf,int outlen)

iconv_t

cd;

int rc;

char **pin =

&inbuf;

char **pout = &outbuf;

cd =

iconv_open(to_charset,from_charset);

if (cd==0) return

-1;

memset(outbuf,0,outlen);

if

(iconv(cd,pin,&inlen,pout,&outlen)==-1) return

iconv_close(cd);

return

0;

u2g(char *inbuf,int inlen,char *outbuf,int

outlen)

code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);

g2u(char *inbuf,size_t inlen,char *outbuf,size_t

code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);

例子2:

用c++语言实现的转换示例程序

/* f.cpp : 代码转换示例c++程序

*/

#include <iconv.h>

<iostream>

using namespace std;

//

代码转换操作类

class codeconverter

private:

public:

构造

codeconverter(const char *from_charset,const char

*to_charset) {

析构

~codeconverter()

转换输出

int convert(char *inbuf,int inlen,char *outbuf,int outlen)

char **pin = &inbuf;

char **pout =

&outbuf;

iconv(cd,pin,(size_t *)&inlen,pout,(size_t

*)&outlen);

};

main(int argc, char **argv)

utf-8-->gb2312

codeconverter cc =

codeconverter("utf-8","gb2312");

cc.convert(in_utf8,strlen(in_utf8),out,outlen);

cout

<< "utf-8-->gb2312 in=" << in_utf8 << ",out=" << out

<< endl;

gb2312-->utf-8

codeconverter cc2 =

codeconverter("gb2312","utf-8");

cc2.convert(in_gb2312,strlen(in_gb2312),out,outlen);

<< "gb2312-->utf-8 in=" << in_gb2312 << ",out=" <<

out << endl;

继续阅读