天天看點

JSP頁面GET請求中文亂碼

位址欄中出現漢字的情況有兩種,一種是漢字出現在URL的路徑部分,一種是漢字出現在URL的傳參的部分,第二種情況的時候必須采用編碼後傳參,接受時解碼的方式完成傳參。

js中編碼有escape(),encodeURI(),encodeURIComponent()三個常用的方法,

escape()常常用在送出頁面和處理頁面的編碼格式相同的情況下(比如它們都是GB2312),

encodeURI()和encodeURIComponent()的用法基本相同,差別在于encodeURIComponent()也對”?”等特殊字元進行編碼。

一開始遇到中文參數的時候,使用encodeURI()進行了一遍編碼,傳過去後,發現解碼出現問題,于是想到可能是編碼方法使用錯誤,于是使用escape()方法,這時發現解碼時抛出isHexDigit異常。借助百度搜尋isHexDigit異常,發現原來,是escape()方法造成了異常,同時了解了浏覽器傳遞位址的一些原理,在浏覽器位址欄裡,浏覽器認為%是個轉義字元,浏覽器會把%與%之間的編碼,兩位兩位取出後進行解碼,然後再傳遞給處理頁面,

然後由處理頁面進行再次解碼。由此我想到一直使用encodeURI方法是正确的,隻是需要使用兩次encodeURI方法,例如encodeURI(encodeURI(“中文”));第一次是把中文編碼成%xy的格式,

第二次是對%xy中的%進行編碼,%編碼成%25。整個傳參過程大體應該是:送出頁面使用encodeURI(encodeURI(“中文”))編碼,把最後的編碼結果%25xy傳遞給處理頁面的過程中,浏覽器擷取URL位址

(注意openModelDialog方法,浏覽器擷取不到參數編碼)後解碼成%xy,然後把%xy傳遞給處理頁面,處理頁面使用URLDecoder.decode(request.getParameter(“參數名”),”UTF-8”);完成解碼。

總結:

1、漢字出現在URL路徑部分的時候不需要編碼解碼;

2、使用encodeURI進行2次編碼;

3、在openModelDialog()打開的模式窗體裡沒辦法用request.getParameter正确擷取參數;

用戶端和伺服器在傳遞資料時可以用過濾器filter解決字元編碼問題,但filter隻能解決post方式送出的資料。對于get方式,可以使用兩次encodeURI(encodeURI(“中文”))并在伺服器中使用URLDecoder.decode(“中文”, “UTF-8”);

今天用Ajax校驗資料時也遇到這個問題,盡管頁面、類和web容器都統一了字元編碼,送出的資料依然是亂碼,是以就采用了2次encodeURI()編碼方式,亂碼問題就解決了。

js
    var name=document.myForm.username.value;  
    //此處也可以直接對整個url進行編碼
    var url="Ajax.do?method=check&name="+encodeURI(encodeURI(name));  
    xmlHttp.open("GET",url,true);  
action
    String name = request.getParameter("name");  
    name = URLDecoder.decode(name, "UTF-8");  
    //servlet傳回資料時,将字元編碼設定為utf-就可以了,因為Ajax隻支援utf-  
    response.setContentType("text/xml;charset=utf-8");  
    PrintWriter out = response.getWriter();  
    out.print(result);  
           

繼續閱讀