上一篇介紹中,我們将二進制檔案(BLOB)儲存為Base64編碼的文本,這些文本可以内嵌在XML的标簽中,是以二進制資訊它可以随着XML檔案被拷貝、下載下傳而不用擔心資訊會缺失。這項技術也在email郵件中被廣泛使用。
浏覽器對Base64的支援
圖像是最經常被使用的一種二進制檔案。而現代的浏覽器的進步日新月異,IE7,FireFox和其他浏覽器為包括Base64在内各種編碼的圖像資訊提供了很好的支援。是以圖形資訊可以以下面的形式呈現在頁面中、
Java代碼
- <img src="
- wAAACwAAAAADwAPAAACIISPeQHsrZ5ModrLlN48CXF8m2iQ3YmmKqVlRtW4ML
- wWACH+H09wdGltaXplZCBieSBVbGVhZCBTbWFydFNhdmVyIQAAOw=="
- alt="Base64 encoded image" width="150" height="150"/>
這種做法有利有弊,好處是浏覽器可以在一個連接配接中得到完成的頁面内容,不好的地方時圖像的大小會增加1/3。是以,這種内嵌的方法适合對小的圖形元素比如圖示、圓角等等進行處理,進而減少浏覽器打開的連接配接數,但對大的照片、圖檔(量少而大)等等則不應該使用Base64編碼以免影響下載下傳速度。
為了得到剛才的Base64編碼,我們将上一篇的Java修改成Struts Action,并借用了JIMI進行圖形的讀取和格式轉換,Base64編碼器則改為更普遍的Apache Commons元件,代碼如下:
Java代碼
- public class Base64ImageAction extends ActionSupport {
- private final static String galleryName = "gallery";
- private static String parent = null;
- private String encodeString = null;
- public String getEncodeString() {
- return encodeString;
- }
- public void setEncodeString(String encodeString) {
- this.encodeString = encodeString;
- }
- private String getImageFullPath() {
- parent = new File(this.getClass().getClassLoader().getResource(
- File.separator).getPath()).getParent()+File.separator+"flag.jpg";
- }
- public String execute() {
- ByteArrayOutputStream output = new ByteArrayOutputStream();
- try {
- JimiReader reader = Jimi.createJimiReader(this.getImageFullPath());
- Image image = reader.getImage();
- Jimi.putImage("image/png", image, output);
- output.flush();
- output.close();
- this.encodeString = Base64.encodeBase64String(output.toByteArray());
- } catch (IOException e) {
- e.printStackTrace();
- } catch (JimiException e) {
- e.printStackTrace();
- }
- return SUCCESS;
- }
- }
對應的View端是個十分簡單的Freemarker模闆:
Html代碼
- <html>
- <head>
- <title>Hello,World</title>
- </head>
- <body>
- <img src="data:image/png;base64,${encodeString}" />
- </body>
- </html>
處理古代浏覽器
世界總是不是那麼完美,盡管大部分現代浏覽器對Base64的處理都十分完善,但是我們不能不考慮到一些“古老”的浏覽器,而現在還是普遍使用的“古老”的浏覽器,就當屬IE6,在IE6裡試圖浏覽上面的圖檔可能會得到一個紅叉叉。我們不得不為IE6做一些特殊處理,利用下面的javascript,我們把Base64字串傳回伺服器端,重新解析成圖檔
Javascript代碼
- // a regular expression to test for Base64 data
- var BASE64_DATA = /^data:.*;base64/i;
- // path to the PHP module that will decode the encoded data
- var base64Path = "/my/path/base64.php";
- function fixBase64(img) {
- // check the image source
- if (BASE64_DATA.test(img.src)) {
- // pass the data to the PHP routine
- img.src = base64Path + "?" + img.src.slice(5);
- }
- };
- // fix images on page load
- onload = function() {
- for (var i = 0; i < document.images.length; i++) {
- fixBase64(document.images[i]);
- }
- };
伺服器端的Struts可以參考上面的例子做反向操作,具體從略。
更完美的方法
将Base64傳回伺服器解碼是不錯的IE6更新檔,但是違背了我們的初衷,對IE6來說,浏覽器連接配接數并未有任何減少。更直接的想法,是否能用Javascript直接在浏覽器中,對Base64文本進行解碼呢?我們構思的場景如下:伺服器端先将圖檔轉換成PNG格式以友善用戶端進行處理,Base64編碼之後,利用JSON将文本傳遞給浏覽器用戶端進行處理。
我們選擇PNG圖形格式是因為PNG已經俨然成為新的Web圖形标準,它格式非常簡單,可以很友善的用javascript進行處理而不需要借助浏覽器的支援。我們知道javascript直接不能處理二進制資料,但是現在這不是個問題,伺服器端已經準備好了Base64編碼的文本資料,現在我們隻需要一個javascript的Base64解析器,你可以在這裡找到一個notmasteryet的Base64解析器。
現在PNG圖形格式采用了DEFLATE作為唯一的壓縮算法,該算法也廣泛應用在ZIP,GZIP等壓縮格式中。PNG圖像格式檔案(或者稱為資料流)由一個8位元組的PNG檔案署名(PNG file signature)域和按照特定結構組織的3個以上的資料塊(chunk)組成。
PNG定義了兩種類型的資料塊,一種是稱為關鍵資料塊(critical chunk),這是标準的資料塊,另一種叫做輔助資料塊(ancillary chunks),這是可選的資料塊。關鍵資料塊定義了4個标準資料塊,其中圖像資料塊IDAT(image data chunk):它存儲實際的資料, PNG總的資料流采用DEFLAT進行壓縮。此外還擦用三角過濾“delta filters”來過濾每一行的像素的未壓縮資料。DEFLAT和delta壓縮在其他資料和文本進行中也被廣泛應用。PNG格式你可以參考<a href="http://www.libpng.org/pub/png/spec/1.1/PNG-Contents.html" target="_blank" rel="external nofollow" >官方文檔</a>。
很棒的,notmasteryet也為我們提供了一個DEFLAT解壓器。
最後,我們把這些組合起來:
Html代碼
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
- <html xmlns="http://www.w3.org/1999/xhtml">
- <head>
- <title>Demo JavaScript PNG Viewer</title>
- </head>
- <body onload="show(gravatar);">
- <script src="../Source/Base64.js" type="text/javascript"></script>
- <script src="../Source/Deflate.js" type="text/javascript"></script>
- <script src="../Source/PNG.js" type="text/javascript"></script>
- <script type="text/javascript">
- var gravatar = 'iVBORw0KGgoAAAANSUhEUgAAA.......資料從略......55CYII=';
- String.prototype.padRight = function(c, n){
- var txt = '';
- for(var i=0;i<n-this.length;i++) txt += c;
- return txt + this;
- };
- function show(data){
- var png = new PNG(data);
- var img = document.getElementById('image'), limg = document.getElementById('largeimage');
- document.getElementById('nativeimage').src = 'data:image/png;base64,' + data;
- img.innerHTML = '';
- limg.innerHTML = '';
- img.style.width = png.width + 'px';
- img.style.height = png.height + 'px';
- limg.style.width = (png.width * 3) + 'px';
- limg.style.width = (png.height * 3) + 'px';
- var line;
- while(line = png.readLine())
- {
- for (var x = 0; x < line.length; x++){
- var px = document.createElement('div'), px2 = document.createElement('div');
- px.className = px2.className = 'pixel';
- px.style.backgroundColor = px2.style.backgroundColor = '#' + line[x].toString(16).padRight('0', 6);
- img.appendChild(px);
- limg.appendChild(px2);
- }
- }
- }
- </script>
- <div id="image"></div>
- <div id="largeimage"></div>
- <img id="nativeimage" />
- </body>
- </html>
還可以更完美
回顧上一篇的例子,我們用了ihard.net提供了Base64編碼,它提供一個GZIP編碼參數,你可以發現如此編碼之後的文本大小和原來的圖形大小相差無幾。利用上一節提供了javascript是不是可以解決Base64編碼後檔案大小增加的問題?留着思考吧。