天天看点

字符编码方式对ELF显示的影响

Linux默认使用的是UTF-8格式文件,所以有时候将Linux下编辑保存后的文件在Windows下查看会发现有乱码。

在一些对编码格式有要求的场合,一定要注意使用正确的编码方式,比如字符叠加等场合,这个坑我是真的踩过的。

使用UTF-8格式编码的源码文件,默认保存为UTF-8格式

字符编码方式对ELF显示的影响

使用gcc编译,默认保存的格式为UTF-8。

#include <stdio.h>

int main(int argc, const char *argv[])
{
	int i = 0;
	unsigned char *str="abc中";

	while (str[i])
	{
		printf("%02X ", str[i]);
		i++;
	}
    
	printf("\n");

    return 0;
}

           

测试结果

字符编码方式对ELF显示的影响
字符编码方式对ELF显示的影响

gcc编译器可以指定输入的编码格式和输出文件的编码格式

输入编码格式: -finput-charset=charset  表示源文件的编码方式, 默认以UTF-8来解析
-fexec-charset=charset   表示可执行程序里的字时候以什么编码方式来表示,默认是UTF-8
           

源文件为GB2312格式编码,通过gcc指定的输入输出,生成UTF-8格式的ELF文件

gcc -finput-charset=GBK -fexec-charset=UTF-8  -o ansi ansi.c 
gcc -o ansi_orig ansi.c
           

发现ELF使用相同的源文件内容,不同的编码格式,结果发生了变化。

字符编码方式对ELF显示的影响

继续阅读