天天看点

Tomcat UTF-8 乱码问题解决办法

关于java的乱码,一直是双字节字符环境开发者的问题,不同的服务,不同的版本,甚至不同的系统环境,都有很大的影响。

今天说一下,在中文windows下,Tomcat5.5服务下的,UTF-8的乱码解决问题。

首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。

其次,Tomcat 5以后,对post和get方法的编码控制分开了,像以前那样,仅仅

request.setCharacterEncoding("utf-8");

response.setCharacterEncoding("utf-8");

不能解决问题了。

明白了这个以后,再来看

第一步,修改tomcat。

找到对应站点的server.xml后,在里面的Connector标签里面添加

useBodyEncodingForURI="true"

这句的话告诉tomcat用页面的编码去处理post,推荐使用。

这块有句更狠的就是

URIEncoding="utf-8"

不过是强制指定编码了,所以一旦有其他编码的页面存在,就会出问题,所以不建议用。

第二步,修改jsp页面头。

我是偷懒,全都加上了

<%@ page language="java"  pageEncoding="UTF-8"%>

,然后在html标签的head标签里加上

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

第三步,修改指定编码。

在jsp头部分,任何request和response被使用前,加上

request.setCharacterEncoding("utf-8");

response.setCharacterEncoding("utf-8");

经过以上三步后,post过来的文字就可以正常的用request.getParameter()取得并使用了。

第四步,修改用get方法传出的连接参数。

new String(java.net.URLEncoder.encode("输入文字","UTF-8"));

记得try一下,我是封装的一下用的。

经过以上几步,基本上乱码的问题解决了。