天天看點

javaWeb 編碼問題

1、html頁面的編碼

  在web應用中,通常浏覽器會根據http header: Content-type的值來決定用什麼encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 頁面使用的就UTF-8編碼。但是考慮到離線的html(使用者可能把頁面html儲存到本地), 打開離線的html的時候就要在meta指定編碼,當然不指定也會有default值,那麼不指定有時就可能出現亂碼。

  Meta标簽

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>

  2、HttpRequest的編碼

  通常浏覽在發送一個請求到伺服器的時候,不會設定字元編碼,在伺服器端為了統一編碼,可以在filter中使用request.setCharacterEncoding("UTF-8")來設定編碼.一般浏覽器都是用預設的ISO-8859-1字元編碼,要解決中文參數亂碼的時候都必須這一步。

  3、httpresponse的編碼

  httpresponse中可以設定輸出到浏覽器的資料使用的編碼方法是response.setCharacterEncoding("UTF-8")和response.setContentType("text/html;charset=UTF-8"),如果隻是單純的設定編碼,最好是用response.setCharacterEncoding("UTF-8"),因為response.setContentType("text/html;charset=UTF-8")是針對具體的MIME類型設定對應的字元編碼。需要注意的是這裡設定的編碼對JSP頁面不一定起作用,理由是JSP頁面有自己設定字元編碼的方式,而且優先級更高。

  4、JSP頁面的編碼

  有以下三種方式,如果同時有第一種和第二種的時候隻有一種會生效(如果不同的話),還有第一種和第二種會覆寫第三種

  最後要注意的是在使用1)或2)聲明編碼類型時,如果頁面中include了其他JSP,對于<%@includefile="BB.jsp"%>和<jsp:includepage="BB.jsp"/>的差別,假設在AA.jsp中使用前一種方式includeBB.jsp,那麼BB.jsp中就不能有重複的編碼的聲明,效果是AA.jsp和BB.jsp都使用AA.jsp中聲明的編碼方式進行編碼。

  如果是使用後一種include的方式的話,AA.jsp和BB.jsp中都可以有各自編碼的聲明。

  1)<%@pagecontentType="text/html;charset=UTF-8"%>

  2)<%@pagepageEncoding="charset=UTF-8"%>

  3)在web.xml中添加以下設定

  1. <jsp-config> 
  2. <jsp-property-group> 
  3. <url-pattern>*.jsp</url-pattern> 
  4. <page-encoding>UTF-8</page-encoding> 
  5. </jsp-property-group> 
  6. </jsp-config>

  5、web.xml和weblogic.xml中的mime的設定

  在web.xml中可以指定mime映射,同時也可以指定對應類型使用的字元編碼(這裡的設定也可以使用3中所說的http response.setContentType和response.setCharacterEncoding來做到),比如:

  1. <mime-mapping> 
  2. <extension>html</extension> 
  3. <mime-type>text/html; charset=UTF-8</mime-type> 
  4. </mime-mapping>

  在weblogic.xml中可以設定預設的mime類型和字元編碼

  1. <container-discriptor> 
  2. <default-mime-type>text/html; charset=UTF-8</default-mime-type> 
  3. </container-discriptor>

  還有

  1. <charset-params> 
  2. <input-charset> 
  3. <resource-path>/*</resource-path> 
  4. <java-charset-name>UTF-8</java-charset-name> 
  5. </input-charset> 
  6. </charset-params>

  總的來說,一個應用中html, http request, http response 和jsp pages中最好顯示地指定相同的字元編碼,最友善的就是都設為UTF-8,所有字元都不會出錯。對于mime mapping的設定最好是在web.xml中設定。weblogic中的關于字元編碼的設定一般不用設定(如果你把前面所說的都設定正确以後)。

繼續閱讀