天天看点

Java BufferReader和FileReader读取文件中字符出现的乱码问题

大概是这样:

windows系统默认编码为GBK,

如果你的eclipse工作空间编码设为:UTF-8。

如果文件中有中文则会乱码。

先在N盘下创建一个test.txt文件,里面写入一下内容,保存。

Java BufferReader和FileReader读取文件中字符出现的乱码问题

然后通过FileReader获取test.txt的字符流,然后用BufferrReader读取字符输入流中的文本,并打印到控制台。

public static void main(String[] args) throws Exception {
		String str;
		FileReader file = new FileReader("n:/test.txt");
		BufferedReader reader = new BufferedReader(file);
		while((str=reader.readLine())!=null) {
			System.out.println(str);
		}
		file.close();
		reader.close();
	}
           

打印结果如下:

Java BufferReader和FileReader读取文件中字符出现的乱码问题

出现乱码。这是因为Windows系统的文件以GBK的方式编码,然后FileReader以工作空间默认的UTF-8方式解码。所以才会出现乱码。

相当于:

byte[] by = "好好学习,天天向上。".getBytes("gbk");
			String str3 = new String(by,"utf-8");
			System.out.println(str3);
           

如果以一下用new String(str.getBytes(“utf-8”),“gbk”),"utf-8"来还原编码,"gbk"再重新解码,看起来没啥问题:但是通过实验来看还是有问题的。

public static void main(String[] args) throws Exception {
		String str;
		FileReader file = new FileReader("n:/test.txt");
		BufferedReader reader = new BufferedReader(file);
		while((str=reader.readLine())!=null) {
			str=new String(str.getBytes("utf-8"),"gbk");
			System.out.println(str);
		}
		file.close();
		reader.close();
	}
           

结果如下:

Java BufferReader和FileReader读取文件中字符出现的乱码问题

这和我们想要的结果不一样,说明用"utf-8"编码回去的过程中出现了错误,所以再用"GBK"解码就会得到不正确的结果。

相当于:

byte[] by = "好好学习,天天向上。".getBytes("gbk");
			String str3 = new String(by,"utf-8");
			str3 = new String(str3.getBytes("utf-8"),"gbk");
			System.out.println(str3);
           

根据我现在的知识,解决方法有以下两种:

1:把你的工作空间编码方式改为"GBK"。

2:用InputStreamReader代替FileReader

代码如下:

public static void main(String[] args) throws Exception {
		String str;
		InputStreamReader file = new InputStreamReader(new FileInputStream("n:/test.txt"),"GBk");
		//FileReader file = new FileReader("n:/test.txt");
		BufferedReader reader = new BufferedReader(file);
		while((str=reader.readLine())!=null) {
			//str=new String(str.getBytes("utf-8"),"gbk");
			System.out.println(str);
		}
		file.close();
		reader.close();
	}
           

通过以上代码我们指明了以"GBK"的方式解码,这样它就不会用工作空间默认的解码方式解码了,运行结果如下:

Java BufferReader和FileReader读取文件中字符出现的乱码问题

这和我们想要的结果一样,OK,问题解决,还有什么解决的方法就得自己慢慢了解了。