1.GBK包含GB2312,即如果通過GB2312編碼後可以通過GBK解碼,反之可能不成立;
2.java.nio.charset.Charset.defaultCharset() 獲得平台預設字元編碼;
3.getBytes() 是通過平台預設字元集進行編碼;
在學習任何一門技術時,經常會有初學者遇到中文亂碼問題,比如MySQL,是因為在安裝時沒有設定;而在Servlet中,也會遇到中文亂碼問題;
比如:
OutputStream out = response.getOutputStream();
out.write(String );
輸出中文時可能會出現亂碼;
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
OutputStream out = response.getOutputStream();
String data = "部落格";
out.write(data.getBytes("UTF-8"));
}
輸出亂碼的問題是程式用UTF-8編碼,而浏覽器用GB2312解碼,是以會出現亂碼;
Servlet亂碼分為request亂碼和response亂碼;
在網上很有效的解決方法是添加:
response.setCharacterEncoding("UTF-8");
解決不了,後來又搜到一條解決方法是:
respnse.setHeader("content-type","text/html;charset=UTF-8");
兩句都填上,後來終于解決了這個問題;
其實我們應該思考一下本質;
我們這裡先來說明一下錯誤的原因,下圖是顯示亂碼的流程圖:

response.setContentType("text/html;charset=UTF-8");
目的是為了控制浏覽器的行為,即控制浏覽器用UTF-8進行解碼;
response.setCharacterEncoding("UTF-8"); 的目的是用于response.getWriter()輸出的字元流的亂碼問題,如果是response.getOutputStream()是不需要此種解決方案的;因為這句話的意思是為了将response對象中的資料以UTF-8解碼後發向浏覽器;
解決方案流程圖:
PrintWriter out = response.getWriter();
out.println(data);
浏覽器輸出: ??
原因:"部落格"首先被封裝在response對象中,因為IE和WEB伺服器之間不能傳輸文本,然後就通過ISO-8859-1進行編碼,但是ISO-8859-1中沒有“部落格”的編碼,是以輸出“??”表示沒有編碼;
而解決方案是:response.setCharacterEncoding("GB2312"); 設定response使用的碼表
<meta http-equiv="content-type" content="text/html"/> 等價于 response.setContentType("text/html");
request請求分為post和get,對于不同的請求方式有不同的解決亂碼的方案;
錯誤原因:
解決方案: