天天看點

JSP中文亂碼問題詳解

解決JSP中文亂碼問題

 大家在JSP的開發過程中,經常出現中文亂碼的問題,可能一至困擾着大家,現把JSP開發中遇到的中文亂碼的問題及解決辦法寫出來供大家參考。首先了解一下Java中文問題的由來:

Java的核心和class檔案是基于unicode的,這使Java程式具有良好的跨平台性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP檔案本身編譯時産生的亂碼問題和Java程式于其他媒介互動産生的亂碼問題。首先Java(包括JSP)源檔案中很可能包含有中文,而Java和JSP源檔案的儲存方式是基于位元組流的,如果Java和JSP編譯成class檔案過程中,使用的編碼方式與源檔案的編碼不一緻,就會出現亂碼。基于這種亂碼,建議在Java檔案中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關系),如果必須寫的話,盡量手動帶參數-ecoding

GBK或-ecoding gb2312或-ecoding UTF-8編譯;對于JSP,在檔案頭加上<%@ page contentType="text/html;charset=GBK"%>或

<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。

下面是一些常見中文亂碼問題的解決方法(下面例子中ecoding采用的是gb2312,也可設為ecoding GBK或ecoding UTF-8):

一、JSP頁面亂碼

這種亂碼問題比較簡單,一般是頁面編碼不一緻導緻的亂碼,一般新手容易出現這樣的問題,具體分以下兩種情況:

未指定使用字元集編碼

下面的顯示頁面(display.jsp)就出現亂碼:

<html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"></head><body><%out.print("JSP的中文處理");%></body></html> 

這種亂碼的原因是沒有在頁面裡指定使用的字元集編碼,JSP頁面中出現了中文字元,而預設的ISO-8859-1字元集中無中文字元,解決方法:隻要在頁面開始地方用下面代碼指定字元集編碼即可,在JSP頁面中指定編碼方式(gb2312),和浏覽器解碼方式設定相同,即在頁面的第一行加上:

<%@ page contentType="text/html; charset=gb2312"%>,就可以消除亂碼了。

完整頁面如下:

<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"></head><body><%out.print("JSP的中文處理");%></body></html>  

編碼字元集設定不一緻

<%@ page language="java" pageEncoding="gb2312"%><%@ page contentType="text/html;charset=iso8859-1"%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"></head><body><%out.print("JSP的中文處理");%></body></html>

這個出現亂碼原因是由于頁面編碼不一緻導緻的亂碼,在這個例子中我們可以看到有三處設定字元集的地方,下面分别了解一下這三處設定具體含義:

第一處<%@ page language="java" pageEncoding="gb2312"%>的編碼格式為jsp檔案的存儲格式。Eclipse會根據這個編碼格式儲存檔案。并編譯jsp檔案,包括裡面的漢字。

第二處編碼為解碼格式。因為存為gb2312的檔案被解碼為iso8859-1,這樣如有中文肯定出亂碼。也就是必須一緻。而第二處所在的這一行,可以沒有。預設也是使用iso8859-1的編碼格式。是以如果沒有這一行的話,也會出現亂碼。必須一緻才可以。 

第三處編碼為控制浏覽器的解碼方式。如果前面的解碼都一緻并且無誤的話,這個編碼格式用不用設定都可以。有的網頁出現亂碼,就是因為浏覽器不能确定使用哪種編碼格式。因為頁面有時候會嵌入頁面,導緻浏覽器混淆了編碼格式出現了亂碼。

完整解決代碼如下:

<%@ page language="java" pageEncoding="gb2312"%><%@ page contentType="text/html;charset= gb2312"%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"></head><body><%out.print("JSP的中文處理");%></body></html>  

二、表單送出中文時出現亂碼

下面是一個送出頁面(submit.jsp),代碼如下:

<%@ page contentType="text/html; charset=gb2312"%> <html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><form name="form1" method="post/get" action="process.jsp"><div align="center"><input type="text"

name="name"><input type="submit" name="Submit" value="Submit"></div></form></body></html>

下面是處理頁面(process.jsp)代碼:

<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><%=request.getParameter("name")%></body></html>

如果submit.jsp送出英文字元能正确顯示,如果送出中文時就會出現亂碼。原因:浏覽器預設使用UTF-8編碼方式來發送請求,而UTF- 8和GB2312編碼方式表示字元時不一樣,這樣就出現了不能識别字元。

POST送出方式

解決辦法:

A、接受參數時進行編碼轉換

String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;

修改後的process.jsp代碼如下: 

<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><%String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;out.print(s);%></body></html>

如果使用該方法的話,每一個參數都必須這樣進行轉碼。很麻煩。但确實可以拿到漢字。

B、通過request.seCharacterEncoding ("gb2312")對請求進行統一編碼,就實作了中文的正常顯示。

修改後的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%><%request.seCharacterEncoding("gb2312");%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><%=request.getParameter("name")%></body></html> 

如果使用該方法接受此參數的頁面就不必在轉碼了,即可得到漢字參數。但每頁都需要執行這句話。

C、為了避免每頁都要寫request.setCharacterEncoding("gb2312"),可以使用過濾器對所有jsp

進行編碼處理。就是使用Servlet規範中的過慮器指定編碼,主要代碼如下:

import java.io.*;import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.servlet.FilterConfig; import javax.servlet.ServletException; import javax.servlet.ServletRequest; import javax.servlet.ServletResponse; public class SetCharacterEncodingFilter

implements Filter {protected String encoding = null; public void destroy(){ this.encoding = null; } public void init(FilterConfig filterConfig) throws ServletException{ this.encoding = filterConfig.getInitParameter("encoding");}public void doFilter(ServletRequest

request, ServletResponse response, FilterChain chain) throws IOException, ServletException{request.setCharacterEncoding(encoding);response.setContentType("text/html;charset="+encoding);chain.doFilter(request, response);}}  

過濾器在web.xml中的配置如下:

<filter><filter-name>SetCharacterEncodingFilter</filter-name><filter-class>SetCharacterEncodingFilter</filter-class><init-param><param-name>encoding</param-name><param-value>gb2312</param-value></init-param></filter><filter-mapping><filter-name>SetCharacterEncodingFilter</filter-name><url-pattern>/*</url-pattern></filter-mapping> 

<%@ page contentType="text/html; charset=gb2312"%><html><head><title>JSP的中文處理</title></head><body><%=request.getParameter("name")%></body></html>  

以上方法隻對POST方式送出有效果。

GET送出方式

如果使用get方式送出中文,接受參數的頁面也會出現亂碼,這個亂碼的原因也是tomcat的内部編碼格式iso8859-1導緻。Tomcat會以get的預設編碼方式iso8859-1對漢字進行編碼,編碼後追加到url,導緻接受頁面得到的參數為亂碼。

解決辦法:

A、 使用POST送出方式解決辦法的第一種方式,對接受到的字元進行解碼,再轉碼。

B 、首先配置tomcat下server.xml的Connector節點增加useBodyEncodingForURI="true"屬性配置,然後在JSP頁面中加入<%request.seCharacterEncoding("gb2312");%>所設定的編碼格式進行編碼。

1、Tomcat中server.xml配置如下:

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" useBodyEncodingForURI="true"/>   

2、修改後的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%><%request.seCharacterEncoding("gb2312");%><html><head><title>JSP的中文處理</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312"></head><body><%=request.getParameter("name")%></body></html>  

三、資料庫連接配接出現亂碼

這種亂碼會使你插入資料庫的中文變成亂碼,或者讀出顯示時也是亂碼,解決方法如下:  在資料庫連接配接字元串中加入編碼字元集 

String Url=" jdbc:sqlserver://localhost:1433; DataBaseName=mydb;user=sa&password=sa&useUnicode=true&characterEncoding=GB2312"; 

 并在JSP頁面中使用如下代碼: 

 

response.setContentType("text/html;charset=gb2312");  request.setCharacterEncoding("gb2312"); 

四、關于jsp在MyEclipse中打開的亂碼問題

對于一個已經存在的項目,Jsp檔案的存儲格式可能是utf-8。如果新安裝的eclipse,則預設打開使用的編碼格式可能iso8859-1。是以導緻 jsp裡面的漢字出現亂碼。這個亂碼魚解決方式如下:

A、Myeclispe Window - > Preferences彈出屬性視窗

General - > Workspace 設定Text file encoding 全局設定。

B、右鍵你的項目---屬性---Text file encoding 項目設定

五、關于html頁面在eclipse中打開出現亂碼情況

由于大部分頁面都是由dreamweaver制作,其存儲格式跟eclipse的識别有差别導緻。

一般這種情況,在eclipse中建立一個jsp,直接從dreamweaver複制頁面内容粘貼到jsp即可。

六、JSP頁面通過URL傳遞中文參數的亂碼問題

在項目中,我們經常遇到需要在jsp頁面切換中傳遞中文字元。例如:

http://website/test1.jsp?act=add&type

=蘋果

一般來說我們很少直接在URL裡面把參數寫成中文,如例子中的"type=蘋果"這樣傳遞。如果出現這種情況,在我們的接收參數的頁面我們隻需要做個簡單的轉換就可以了。

代碼test1.jsp:(主要部分)

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%><%String type = request.getParameter("type");String result = new String(type.getBytes("iso-8859-1"), "gb2312");out.println(result);%>

更普遍的做法,就是對url中的中文字元進行編碼,變成類似type=%20D%20B這樣的字元。

代碼MyJsp1.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%><%@ page import="java.net.*" %><a href='./MyJsp2.jsp?act=<%=URLEncoder.encode("中國人 非常好")%>'>test</a> 

代碼MyJsp2.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%><%@ page import="java.net.*" %><%String tempVal = URLDecoder.decode(request.getParameter("act"));out.println(new String(tempVal.getBytes("ISO-8859-1"), "gb2312"));%>