Servlet中response、request亂碼問題解決

一、request請求參數出現的亂碼問題　　

　　　　get請求：

　　　　　　　　get請求的參數是在url後面送出過來的，也就是在請求行中，

　　　　　　　　MyServlet是一個普通的Servlet，浏覽器通路它時，使用get請求方式送出了一個name=小明的參數值，在doGet中擷取該參數值，并且列印到控制台，發現出現亂碼

　　　　　　　　出現亂碼的原因：

　　　　　　　　　　　　　　前提知識：需要了解碼表，編碼，解碼這三個名詞的意思。我簡單說一下正常的，

　　　　　　　　　　　　　　　　　　碼表：是一種規則，用來讓我們看得懂的語言轉換為電腦能夠認識的語言的一種規則，有很多中碼表，IS0-8859-1,GBK,UTF-8,UTF-16等一系列碼表，比如GBK,UTF-8,UTF-16都可以辨別一個漢字，而如果要辨別英文，就可以用IS0-8859-1等别的碼表。

　　　　　　　　　　　　　　　　　　編碼：将我們看得懂的語言轉換為電腦能夠認識的語言。這個過程就是編碼的作用

　　　　　　　　　　　　　　　　　　解碼：将電腦認識的語言轉換為我們能看得懂得語言。這個過程就是解碼的作用

詳細請參考這篇博文。

　　　　　　　　　　　　　　　　　　這裡隻能夠代表經過一次編碼例子，有些程式中，會将一個漢字或者一個字母用不同的碼表連續編碼幾次，那麼第一次編碼還是上面所說的作用，第二次編碼的話，就是将電腦能夠認識的語言轉換為電腦能夠認識的語言(轉換規則不同)，那麼該解碼過程，就必須要經過兩次解碼，也就是編碼的逆過程，下面這個例子就很好的說明了這個問題。

　　　　　　　　　　　　　　浏覽器使用的是UTF-8碼表，通過http協定傳輸，http協定隻支援IS0-8859-1，到了伺服器，預設也是使用的是IS0-8859-1的碼表，看圖

　　　　　　　　　　　　　　也就是三個過程，經曆了兩次編碼，是以就需要進行兩次解碼，

　　　　　　　　　　　　　　1、浏覽器将"小明"使用UTF-8碼表進行編碼(因為小明這個是漢字，是以使用能辨別中文的碼表，這也是我們可以在浏覽器上可以手動設定的，如果使用了不能辨別中文的碼表，那麼就将會出現亂碼，因為碼表中找不到中文對應的計算機符号，就可能會用？？等其他符号表示)，編碼後得到的為 1234 ，将其通過http協定傳輸。

　　　　　　　　　　　　　　2、在http協定傳輸，隻能用ISO-8859-1碼表中所代表的符号，是以會将我們原先的1234再次進行一次編碼，這次使用的是ISO-8859-1，得到的為 ???? ，然後傳輸到伺服器

　　　　　　　　　　　　　　3、伺服器擷取到該資料是經過了兩次編碼後得到的資料，是以必須跟原先編碼的過程逆過來解碼，先是UTF-8編碼，然後在ISO-8859-1編碼，那麼解碼的過程，就必須是先ISO-8859-1解碼，然後在用UTF-8解碼，這樣就能夠得到正确的資料。????.getBytes("ISO-8859-1");//第一次解碼，轉換為電腦能夠識别的語言， new String(1234,"UTF-8");//第二次解碼，轉換為我們認識的語言

　　　　　　　　　　　　　　解決代碼

　　　　Post請求：

　　　　　　　　　　post請求方式的參數是在請求體中，相對于get請求簡單很多，沒有經過http協定這一步的編碼過程，是以隻需要在伺服器端，設定伺服器解碼的碼表跟浏覽器編碼的碼表是一樣的就行了，在這裡浏覽器使用的是UTF-8碼表編碼，那麼伺服器端就設定解碼所用碼表也為UTF-8就OK了

　　　　　　　　　　設定伺服器端使用UTF-8碼表解碼

　　　　　　　　　　　　　　request.setCharacterEncoding("UTF-8");　　//指令Tomcat使用UTF-8碼表解碼，而不用預設的ISO-8859-1了。

　　　　　　　　　　是以在很多時候，在doPost方法的第一句，就是這句代碼，防止擷取請求參數時亂碼。

　　　　　總結請求參數亂碼問題

　　　　　　　　　　get請求和post請求方式的中文亂碼問題處理方式不同

　　　　　　　　　　　　get:請求參數在請求行中，涉及了http協定，手動解決亂碼問題，知道出現亂碼的根本原因，對症下藥，其原理就是進行兩次編碼，兩次解碼的過程

　　　　　　　　　　　　　　new String(xxx.getBytes("ISO-8859-1"),"UTF-8");

　　　　　　　　　　　　post：請求參數在請求體中，使用servlet API解決亂碼問題，其原理就是一次編碼一次解碼，指令tomcat使用特定的碼表解碼。

　　　　　　　　　　　　　　request.setCharaterEncoding("UTF-8");

二、response響應回浏覽器出現的中文亂碼。　　　　　　　　　　

　　　　　　首先介紹一下，response對象是如何向浏覽器發送資料的。兩種方法，一種getOutputStream，一種getWrite。

　　　　　　　　ServletOutputStream getOutputStream();　　//擷取輸出位元組流。提供write() 和 print() 兩個輸出方法

　　　　　　　　PrintWriter getWrite();　　//擷取輸出字元流　　提供write() 和 print()兩個輸出方法

　　　　　　　　　　print()方法底層都是使用write()方法的，相當于print()方法就是将write()方法進行了封裝，使開發者更友善快捷的使用，想輸出什麼，就直接選擇合适的print()方法，而不用考慮如何轉換位元組。

　　　　　　1、ServeltOutputStream getOutputStream();

　　　　　　　　　　不能直接輸出中文，直接輸出中文會報異常，

　　　　　　　　　　　報異常的源代碼

　　　　　　　　　　解決：

　　　　　　　　　　　　resp.getoutputStream().write("哈哈哈，我要輸出到浏覽器".getBytes("UTF-8"));

　　　　　　　　　　　　将要輸出的漢字先用UTF-8進行編碼，而不用讓tomcat來進行編碼，這樣如果浏覽器用的是UTF-8碼表進行解碼的話，那麼就會正确輸出，如果浏覽器用的不是UTF-8，那麼還是會出現亂碼，是以說這個關鍵要看浏覽器用的什麼碼表，這個就不太好，這裡還要注意一點，就是使用的是write(byte)方法，因為print()方法沒有輸出byte類型的方法。

　　　　　　2、PrintWriter getWrite();

　　　　　　　　　　直接輸出中文，不會報異常，但是肯定會報異常，因為用ISO-8859-1的碼表不能辨別中文，一開始就是錯的，怎麼解碼編碼讀沒用了

　　　　　　　　　　有三種方法來讓其正确輸出中文

　　　　　　　　　　1、使用Servlet API response.setCharacterEncoding()

　　　　　　　　　　　　　　response.setCharacterEncoding("UTF-8");　　//讓tomcat将我們要響應到浏覽器的中文用UTF-8進行編碼，而不使用預設的ISO-8859-1了，這個還是要取決于浏覽器是不是用的UTF-8的碼表，跟上面的一樣有缺陷

　　　　　　　　　　2、通知tomcat和浏覽器都使用同一張碼表

　　　　　　　　　　　　　　response.setHeader("content-type","text/html;charset=uft-8");　　//手動設定響應内容，通知tomcat和浏覽器使用utf-8來進行編碼和解碼。

　　　　　　　　　　　　　　　　　　charset=uft-8就相當于response.setCharacterEncoding("UTF-8");//通知tomcat使用utf-8進行編碼

　　　　　　　　　　　　　　　　　　response.setHeader("content-type","text/html;charset=uft-8");//合起來，就是既通知tomcat用utf-8編碼，又通知浏覽器用UTF-8進行解碼。

　　　　　　　　　　　　　　response.setContentType("text/html;charset=uft-8");　　//使用Servlet API 來通知tomcaat和強制浏覽器使用UTF-8來進行編碼解碼，這個的底層代碼就是上一行的代碼，進行了簡單的封裝而已。　　　　　　　　　　　　　　　　　　　　　　　　　　

　　　　　　　　　　3、通知tomcat，在使用html<meta>通知浏覽器 (html源碼)，注意：<meta>建議浏覽器應該使用編碼，不能強制要求

　　　　　　　　　　　　　　進行兩步

　　　　　　　　　　是以response在響應時，隻要通知tomcat和浏覽器使用同一張碼表，一般使用第二種方法，那麼就可以解決響應的亂碼問題了

三、總結

　　　　　　在上面講解的時候總是看起來很繁瑣，其實知道了其中的原理，很簡單，現在來總結一下，

　　　　　　請求亂碼

　　　　　　　　　　get請求：

　　　　　　　　　　　　　　經過了兩次編碼，是以就要兩次解碼

　　　　　　　　　　　　　　第一次解碼：xxx.getBytes("ISO-8859-1");得到yyy

　　　　　　　　　　　　　　第二次解碼：new String(yyy,"utf-8");

　　　　　　　　　　　　　　連續寫：new String(xxx.getBytes("ISO-8859-1"),"UTF-8");

　　　　　　　　　　post請求：

　　　　　　　　　　　　　　隻經過一次編碼，是以也就隻要一次解碼,使用Servlet API　request.setCharacterEncoding();

　　　　　　　　　　　　　　request.setCharacterEncoding("UTF-8");　　//不一定解決，取決于浏覽器是用什麼碼表來編碼，浏覽器用UTF-8，那麼這裡就寫UTF-8。

　　　　　響應亂碼

　　　　　　　　　　getOutputStream();

　　　　　　　　　　　　　　使用該位元組輸出流，不能直接輸出中文，會出異常，要想輸出中文，解決方法如下

　　　　　　　　　　　　　　解決：getOutputStream().write(xxx.getBytes("UTF-8"));　　//手動将中文用UTF-8碼表編碼，變成位元組傳輸，變成位元組後，就不會報異常，并且tomcat也不會在編碼，因為已經編碼過了，是以到浏覽器後，如果浏覽器使用的是UTF-8碼表解碼，那麼就不會出現中文亂碼，反之則出現中文亂碼，是以這個方法，不能完全保證中文不亂碼

　　　　　　　　　　getWrite();

　　　　　　　　　　　　　　使用字元輸出流，能直接輸出中文，不會出異常，但是會出現亂碼。能用三種方法解決，一直使用第二種方法

　　　　　　　　　　　　　　解決：通知tomcat和浏覽器使用同一張碼表。

　　　　　　　　　　　　　　　　response.setContentType("text/html;charset=utf-8");　　//通知浏覽器使用UTF-8解碼

　　　　　　　　　　　　　　　　　　通知tomcat和浏覽器使用UTF-8編碼和解碼。這個方法的底層原理是這句話：response.setHeader("contentType","text/html;charset=utf-8");

　　　　　　　　　　注意：getOutputStream()和getWrite() 這兩個方法不能夠同時使用，一次隻能使用一個，否則報異常

Servlet中response、request亂碼問題解決

繼續閱讀

如何成為一名Java開發者？

在核心模式驅動程式中調用 DLL

ASSERT與VERIFY宏的差別

WebBrowser獨立IE使用代理

java基礎知識問答集

Havok Physics 翻譯資料（1）Chapter 1.介紹

Facebook官方文檔學習 - 調用接口篇

郵箱被盜，受到網絡釣魚攻擊，如何甄别規避？

用Windows Live Writer寫CSDN博

[轉] 擷取實時股票資料與股票資料接口API

RFC SDK 指南用戶端程式的編寫

Java8新的時間API擷取時間內插補點Java8新的時間API擷取時間內插補點與以前的java.util.Date擷取時間內插補點對比

手機軟體抓包工具及其使用方法

推薦一些VB的學習交流網站

GNU科學函數庫[參考手冊][v0.1 Build 090129 Beta][GNU Scientific Library]

與專家面對面：Android開發入門問與答