天天看點

java 配置Apache,Tomcat的gzip壓縮功能

HTTP 壓縮可以大大提高浏覽網站的速度,它的原理是,在用戶端請求網 頁後,從伺服器端将網頁檔案壓縮,再下載下傳到用戶端,由用戶端的浏覽器負責解 壓縮并浏覽。相對于普通的浏覽過程HTML ,CSS,Javascript , Text ,它可以節省40%左右的流量。更為重要的是,它可以對動态生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等輸出的網頁也能進行壓縮,壓縮效率驚人

一 對于Tomcat5.0以後的版本是支援對輸出内容進行壓縮的. 使用的是gzip壓縮格式

下 面是tomcat5.5.20 中的$tomcat_home$/conf/server.xml的原内容 1      < Connector  port ="80"  maxHttpHeaderSize ="8192" 

                maxThreads ="150"  minSpareThreads ="25"  maxSpareThreads ="75" 

             enableLookups ="false"  redirectPort ="8443"  acceptCount ="100" 

                 connectionTimeout ="20000"  disableUploadTimeout ="true"  URIEncoding ="utf-8"   /> 

      <!--  Note : To disable connection timeouts, set connectionTimeout value

      to 0  -->

      <!--  Note : To use gzip compression you could set the following properties :

                compression="on" 

                compressionMinSize="2048" 

                noCompressionUserAgents="gozilla, traviata" 

                compressableMimeType="text/html,text/xml"

    -->從上面的第 8行内容可以看出,要使用gzip壓縮功能,你可以在Connector執行個體中加上如下 屬性即可

1) compression="on" 打開壓縮功能

2) compressionMinSize="2048" 啟用壓縮的輸出内容大小,這裡面預設為2KB

3) noCompressionUserAgents="gozilla, traviata" 對于以下的浏覽器,不啟用壓縮 

4) compressableMimeType="text/html,text/xml" 壓縮類型(預設為text/html,text/xml,text/plain)

我 這裡的配置内容為:

     <Connector port="80" maxHttpHeaderSize="8192"

                maxThreads="150" minSpareThreads="25" maxSpareThreads="75"

                enableLookups="false" redirectPort="8443" acceptCount="100"

                connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="utf-8"

                   compression="on" 

                compressionMinSize="2048" 

                noCompressionUserAgents="gozilla, traviata" 

               compressableMimeType="text/html,text/xml,text/javascript,text/css,text/plain"  />

    <!-- Note : To disable connection timeouts, set connectionTimeout value

     to 0 -->

    <!-- Note : To use gzip compression you could set the following properties :

               compression="on" 

               compressionMinSize="2048" 

               noCompressionUserAgents="gozilla, traviata" 

              compressableMimeType="text/html,text/xml"

   -->

一旦啟用了這個壓縮功能後,我們怎麼來測試壓縮是否有效呢?首先Tomcat是根據浏覽器請求頭中的accept-encoding來判斷浏覽器是否支援 壓縮功能,如果這個值包含有gzip,就表明浏覽器支援gzip壓縮内容的浏覽,是以我們可以用httpclient來寫一個這樣的簡單測試程式

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.methods.GetMethod;

public class HttpTester {

public static void main(String[] args) throws Exception{

  HttpClient http = new HttpClient();

  GetMethod get = new GetMethod("http://www.dlog.cn/js/prototype.js");

  try{

  get.addRequestHeader("accept-encoding", "gzip,deflate");

  get.addRequestHeader("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Alexa Toolbar; Maxthon 2.0)");

  int er = http.executeMethod(get);

  if(er==200){

   System.out.println(get.getResponseContentLength());

   String html = get.getResponseBodyAsString();

   System.out.println(html);

   System.out.println(html.getBytes().length);

  }

}finally{

   get.releaseConnection();

}

}

}

執行這個測試程式,看看它所輸出的是什麼内容,如果輸出的是一些 亂碼,以及列印内容的長度遠小于實際的長度,那麼恭喜你,你的配置生效了,你會發現你網站的浏覽速度比以前快多了。

二, 對于Apache而言,有兩種情況

 1)針對Apache2.0之前的版本,它原本是不支援 的,不過可以通過添加第三方的module_gzip子產品來啟用

 2)針對Apache2.0及之後的版本,Apache提供支援, 不過不叫gzip,而叫mod_deflate

下面就對Apache2.0及之後的版本作一個說明

1) 去掉#LoadModule headers_module modules/mod_headers.so前面的注釋#,

2) 添加LoadModule deflate_module modules/mod_deflate.so

3) 在VirtualHost中添加

1    <Location "/">

2        SetOutputFilter DEFLATE

3        BrowserMatch ^Mozilla/4 gzip-only-text/html

4        BrowserMatch ^Mozilla/4\.0[678] no-gzip

5        BrowserMatch \bMSIE !no-gzip !gzip-only-text/html

6        SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary

7        Header append Vary User-Agent env=!dont-vary

8    </Location>

9

我這裡面有一個完整的示範

 1# 加載deflate子產品

 2LoadModule headers_module modules/mod_headers.so

 3LoadModule deflate_module modules/mod_deflate.so

 4<VirtualHost *:80>

 5    DocumentRoot f:/apacheTest

 6    <Location "/">

 7        SetOutputFilter DEFLATE

 8        BrowserMatch ^Mozilla/4 gzip-only-text/html

 9        BrowserMatch ^Mozilla/4\.0[678] no-gzip

10        BrowserMatch \bMSIE !no-gzip !gzip-only-text/html

11        SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary

12        Header append Vary User-Agent env=!dont-vary

13    </Location>

14</VirtualHost>

關于 JavaScript的gzip靜态壓縮方法傳統的JS壓縮(删除注釋,删除多餘空格等)提供的壓縮率有時還是不盡不意,幸虧現在的浏覽器都支援壓縮傳輸(通過設定http header的Content-Encoding=gzip),可以通過伺服器的配置(如apache)為你的js提供壓縮傳輸,或是appfuse中使 用的GZipFilter使tomcat也提供這種能力

現在的問題是這種動态的壓縮會導緻伺服器CPU占用率過高,現在我想到的解決辨法是通過提供靜态壓縮(就是将js預先通過gzip.exe壓縮 好)

一.下面描述在tomcat中的應用

1.将prototype.js通過gzip.exe壓縮儲存成prototype.gzjs

2.設定header,我編寫了一個簡單的AddHeadersFilter來将所有以gzjs結尾的檔案增加設定header Content-Encoding=gzip

web.xml中的配置

<filter>

<filter-name>AddHeaderFilter</filter-name>

<filter-class>

badqiu.web.filter.AddHeaderFilter

</filter-class>

<init-param>

<param-name>headers</param-name>

<param-value>Content-Encoding=gzip</param-value>

</init-param>

</filter>

<filter-mapping>

<filter-name>AddHeaderFilter</filter-name>

<url-pattern>*.gzjs</url-pattern>

</filter-mapping>

測試prototype.js是否正常的代碼

<html>

<head>

<!-- type="text/javascript"不可少,有些浏覽器缺少這個不能運作,具體已經忘記了 -->

<script src="prototype.gzjs" type="text/javascript"></script>

</head>

<body>

<input id="username" name="username" value="badqiu"/><br />

<input id="email" value="[email protected]"/>

<script>

<!-- 測試prototype的方法是否正常-->

alert($F('username'))

</script>

</body>

</html>

在Apache httpd中可以直接通過在httpd.conf增加AddEncoding x-gzip .gzjs來映射.gzjs檔案的header

二.相關壓縮率資料

1. prototype.js 1.5.0_rc0原始大小56KB,未經任何處理直接使用gzip壓縮為12KB,總壓縮率79%

2. 通過js壓縮工具壓縮過的protytype.js為20KB,使用gzip壓縮為10KB,總壓縮率為83%

3. 實際項目中的多個js合并成的檔案 439KB,直接通過gzip壓縮為85KB,總壓縮率81%

4. 439KB經過js壓縮為165KB,再經過gzip壓縮為65KB,總壓縮率86%

基本上你都可以忽略js壓縮工具的壓縮率,直接使用gzip壓縮

gzip下載下傳位址  http://www.gzip.org

tomcat的壓縮配置示例下載下傳位址: http://www.blogjava.net/Files/badqiu/gziptest.rar

繼續閱讀