天天看點

《新編計算機科學概論》一1.3 非數值資訊的編碼

編碼通常指在人和機器之間進行資訊轉換的一種體系,是人們在實踐中逐漸創造的一種用較少的符号來表達較複雜資訊的表示方法。比如我們前面談到的數字,實際上就是一種編碼,用一串數符代表規模更大的數。人們用0 ~ 9這十個數字的組合,表達的概念遠比10要豐富得多。編碼的基本目的是為了資訊交流,人們研究編碼是為了以更簡便的形式表達更豐富的資訊。

随着現代計算機運用的深入,計算機不僅僅用于科學計算,實際上更大量的工作是用于處理人們日常工作和生活中最常使用的資訊形式,也就是所謂的非數值型資料。計算機中使用不同的編碼來表示和存儲數字、文字元号、聲音、圖檔和圖像(視訊)等不同類型的資訊。計算機科學中研究編碼的目的是為了友善計算機表示、處理和存儲各種類型的資訊。由于計算機硬體能夠直接識别和處理的隻是0、1這樣的二進制資訊,是以必須研究在計算機中如何通過二進制編碼來表示和處理這些非數值型資料。由于非數值型資料所使用的二進制編碼并不表示數值,是以也将非數值型資料稱為符号資料。

數字計算機的存儲器按位存儲,是以在計算機上處理的資訊必須按位的形式表示。而世界上大量堆積的資訊是文本形式的,就像裝滿圖書館的書報和雜志。通過對二進制編碼的研究,使得計算機不僅能處理數字,還能表示、存儲、處理和提供人類交流中所使用的各種資訊,包括視覺資訊(如文字和圖檔)、聽覺資訊(如語言、聲音及音樂),還有混合資訊(如動畫和電影)等。所有這些資訊類型都要求使用各自的編碼方式。

ascii碼

字元是非數值型資料的基礎,字元與字元串資料是計算機中用得最多的非數值型資料。在使用計算機的過程中,人們需要利用字元與字元串編寫程式、表示文字及各類資訊,以便與計算機進行交流。為了使計算機硬體能夠識别和處理字元,必須對字元按一定規則用二進制進行編碼,使得系統裡的每一個字元有唯一的編碼;文本中還存在數字和标點符号,是以也必須有它們的編碼。簡單地說,所有字母、數字和符号都要編碼,這樣的系統稱作字元編碼集,每一個編碼稱作字元編碼。注意文本中的數字與前面我們讨論的數值是不一樣的。在文本中的數字,計算機将其視為字元,而不能進行算術運算。

電子計算機是美國人首先發明的,他們最先制定了符合他們使用習慣的美國标準資訊交換标準碼(american standard code for information interchange),簡稱ascii碼。

ascii編碼是由美國國家标準學會(american national standard institute,簡稱ansi)制定的标準單位元組字元編碼方案,用于基于文本的資料。它最初是美國國家标準,供不同計算機在互相通信時用作共同遵守的西文字元編碼标準,後來被國際标準化組織(international organization for standardization,簡稱iso)定為國際标準,稱為iso 646标準,适用于所有拉丁字母。

ascii 碼使用指定的7位或8位二進制數組合來表示128或256種可能的字元。标準 ascii碼也稱為基礎ascii碼,使用7位二進制數來表示所有的大寫和小寫字母、數字0到9、标點符号,以及在美式英語中使用的特殊控制字元。如圖1?3所示為标準ascii表。

其中:0 ~ 32及127(共34個)是控制字元或通信專用字元(其餘為可顯示字元),如控制符lf(換行)、cr(回車)、ff(換頁)、del(删除)、bs(倒退)、bel(振鈴)等;通信專用字元soh(文頭)、eot(文尾)、ack(确認)等。ascii值為8、9、10 和13分别轉換為倒退、制表、換行和回車字元,它們并沒有特定的圖形顯示,但會對文本顯示有不同的影響。33 ~ 126 (共94個)是字元,其中48 ~ 57為0 ~ 9十個阿拉伯數字; 65 ~ 90為26個大寫英文字母,97 ~ 122為26個小寫英文字母,其餘為一些标點符号、運算符号等。

同時還要注意,在标準ascii中,其最高位(b7)用作奇偶校驗位。所謂奇偶校驗是指在代碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正确的代碼一個位元組中1的個數必須是奇數,若非奇數則在最高位添1。偶校驗規定:正确的代碼一個位元組中1的個數必須是偶數,若非偶數則在最高位添1。

後128個稱為擴充ascii碼,許多系統都支援使用擴充ascii。擴充ascii 碼允許将每個字元的第8位用于确定附加的128個特殊符号字元、外來語字母和圖形符号。

進制 十六進制 十

進制 字元 八

進制 字元

00 00 0 nul 40 20 32 sp 100 40 64 @ 140 60 96 '

01 01 1 soh 41 21 33 ! 101 41 65 a 141 61 97 a

02 02 2 stx 42 22 34 " 102 42 66 b 142 62 98 b

03 03 3 etx 43 23 35 # 103 43 67 c 143 63 99 c

04 04 4 eot 44 24 36 $ 104 44 68 d 144 64 100 d

05 05 5 enq 45 25 37 % 105 45 69 e 145 65 101 e

06 06 6 ack 46 26 38 & 106 46 70 f 146 66 102 f

07 07 7 bel 47 27 39 ` 107 47 71 g 147 67 103 g

10 08 8 bs 50 28 40 ( 110 48 72 h 150 68 104 h

11 09 9 ht 51 29 41 ) 111 49 73 i 151 69 105 i

12 0a 10 nl 52 2a 42 * 112 4a 74 j 152 6a 106 j

13 0b 11 vt 53 2b 43 + 113 4b 75 k 153 6b 107 k

14 0c 12 ff 54 2c 44 , 114 4c 76 l 154 6c 108 l

15 0d 13 er 55 2d 45 - 115 4d 77 m 155 6d 109 m

16 0e 14 so 56 2e 46 . 116 4e 78 n 156 6e 110 n

17 0f 15 si 57 2f 47 / 117 4f 79 o 157 6f 111 o

20 10 16 dle 60 30 48 0 120 50 80 p 160 70 112 p

21 11 17 dc1 61 31 49 1 121 51 81 q 161 71 113 q

22 12 18 dc2 62 32 50 2 122 52 82 r 162 72 114 r

23 13 19 dc3 63 33 51 3 123 53 83 s 163 73 115 s

24 14 20 dc4 64 34 52 4 124 54 84 t 164 74 116 t

25 15 21 nak 65 35 53 5 125 55 85 u 165 75 117 u

26 16 22 syn 66 36 54 6 126 56 86 v 166 76 118 v

27 17 23 etb 67 37 55 7 127 57 87 w 167 77 119 w

30 18 24 can 70 38 56 8 130 58 88 x 170 78 120 x

31 19 25 em 71 39 57 9 131 59 89 y 171 79 121 y

32 1a 26 sub 72 3a 58 : 132 5a 90 z 172 7a 122 z

33 1b 27 esc 73 3b 59 ; 133 5b 91 [ 173 7b 123 {

34 1c 28 fs 74 3c 60 < 134 5c 92 174 7c 124 |

35 1d 29 gs 75 3d 61 = 135 5d 93 ] 175 7d 125 }

36 1e 30 re 76 3e 62 > 136 5e 94 ^ 176 7e 126 ~

37 1f 31 us 77 3f 63 ? 137 5f 95 _ 177 7f 127 del

圖1?3 标準ascii表

ascii碼是計算機世界裡最重要的标準,但它存在嚴重的國際化問題。ascii碼隻适用于美國,它并不完全适用于其他以非英語為主要語言的國家,如希臘文、阿拉伯文、希伯來文和西裡爾文,對于東方以漢字為代表的象形文字這一巨大的集合更是無能為力。

漢字的編碼

漢字也是字元,與西文字元比較,漢字數量大,字形複雜,同音字多,這就給漢字在計算機内部的存儲、傳輸、交換、輸入、輸出等帶來了一系列問題。為了能直接使用西文标準鍵盤輸入漢字,還必須為漢字設計相應的輸入編碼,以适應計算機處理漢字的需要。

(1)國标碼

1980年我國頒布了《資訊交換用漢字編碼字元集基本集》代号為gb2312-80,是國家規定的用于漢字資訊處理使用的代碼依據,這種編碼稱為國标碼。在國标碼的字元集中共收錄了6 763個常用漢字和682個非漢字字元(圖形、符号),其中一級漢字3 755個,以漢語拼音為序排列,二級漢字3 008個,以偏旁部首進行排列。

國标gb2312-80規定,所有的國标漢字與符号組成一個94×94的矩陣,在此方陣中,每一行稱為一個“區” (區号為01 ~ 94),每一列稱為一個“位”(位号為01 ~ 94),該方陣實際組成了一個具有94個區,每個區内有94個位的漢字字元集,每一個漢字或符号在碼表中都有一個唯一的位置編碼,稱為該字元的區位碼。

使用區位碼方法輸入漢字時,必須先在表中查找漢字并找出對應的代碼才能輸入。區位碼輸入漢字的優點是無重碼,而且輸入碼與内部編碼的轉換友善。

(2)機内碼

漢字的機内碼是計算機系統内部對漢字進行存儲、處理、傳輸統一使用的代碼,又稱為漢字内碼。漢字内碼是與ascii碼對應的,用二進制對漢字進行的編碼。由于漢字數量多,一般用兩個位元組來存放漢字的内碼,即雙位元組字元集(double-byte character set,簡稱dbcs)。在計算機内漢字字元必須與英文字元差別開,以免造成混亂。英文字元的機内碼是用一個位元組來存放ascii碼,一個ascii碼占一個位元組的低7位,最高位為“0”,為了區分,漢字機内碼中兩個位元組的最高位均置“1”。

例如,漢字“中”的國标碼為5650h (0101011001010000)2,機内碼為d6d0h (110101101101 0000)2。

需要注意的是,在漢字字元集中,為了顯示和列印等排版的需要,也定義了英文和其他語言中的符号,這些符号在計算機中是作為中文文字處理的,不再是它原來語種的符号。這些符号稱為全角符号,比如字元“A”與字母“a”之間的差別。

(3)漢字的輸入編碼

漢字輸入通常有鍵盤輸入、語音輸入、手寫輸入等方法,都有一定的優缺點。鍵盤輸入方式:将每個漢字用一個或幾個英文鍵表示,這種表示方法稱為漢字的“輸入編碼”。輸入編碼與内碼不同,它是專為解決漢字輸入設計的,漢字輸入後仍是以内碼存儲在計算機中,這種轉換由系統中特殊的部分自動進行。輸入編碼的基本元素是标準鍵盤上可見的字母符号。漢字輸入編碼種類很多,根據輸入編碼的方式大體可将漢字輸入編碼分為四類:

1)數字編碼。如電報碼、區位碼等。特點:難于記憶,不易推廣。

2)字音編碼。如拼音碼等。特點:簡單易學,但重碼多。

3)字形編碼。如五筆字型、表形碼等。特點:重碼少,輸入快,但不易掌握。

4)音形編碼。如自然碼、快速碼等。特點:規則簡單,重碼少,但不易掌握。

unicode碼

盡管多年來ascii碼占據主要地位,但是現在其他更具擴充性的代碼也越來越普及,這些代碼能夠表示各種語言的文檔資料。其中之一是unicode,它是由硬體及軟體的多家主導廠商共同研制開發的,并很快得到計算界的支援。這種代碼采用唯一的16位模式來表示每一個符号。是以,unicode由65 536個不同的位模式組成——足以表示用中文、日文和希伯來文等語言書寫的文檔資料。

unicode即統一碼,又稱萬國碼,是一種以滿足跨語言、跨平台進行文本轉換、處理的要求為目的設計的計算機字元編碼。它為每種語言中的每個字元設定了統一并且唯一的二進制編碼。unicode 的編碼方式與 iso 10646 的通用字元集(亦稱通用字元集)概念相對應,使用16位的編碼空間,也就是每個字元占用兩個位元組。實際上目前版本的 unicode 尚未填充滿這16位編碼,保留了大量空間作為特殊使用或将來擴充。上述16位 unicode 字元構成基本多文種平面(basic multilingual plane,簡稱 bmp)。unicode 中定義了16個輔助平面,輔助平面字元占用4位元組編碼空間,共需占據32位,理論上最多能表示231個字元,完全可以涵蓋一切語言所用的符号。

對于中文而言,unicode 16編碼已經包含了gb18030的所有漢字(27 484個字),目前unicode标準準備把康熙字典的所有漢字放入unicode編碼中。

總之,unicode擴充自ascii字元集。unicode使用16位元編碼,并可擴充到32位,這使得unicode能夠表示世界上所有書寫語言中可能用于計算機通信的字元、象形文字和其他符号。unicode最初打算作為ascii的補充,可能的話,最終将代替它。

1.3.2 靜态圖像的編碼

靜态圖像是與動态圖像相對應的概念,專門指單幅的圖形。在計算機應用中經常需要用到各種圖像的顯示與處理,比如統計圖、照片等。

位圖圖像

在用位圖表示圖像的方法中,圖像被分成像素矩陣,也稱點陣,每個像素是一個小點。像素的大小取決于分辨率。同樣大小的圖像,分辨率越高,意味着每個點越小,圖像品質越精細,顯示得更加清楚,但是需要更多的記憶體來存儲圖像。一般用機關長度的點數來描述圖像分辨率,比如一般螢幕顯示的分辨率為72 dpi(dot per inch,每英寸的點數)。列印機通常可以支援300 ~ 600 dpi。

在把圖像分成像素之後,每一個像素被指派為一個位模式。模式的尺寸和值取決于圖像。對于一個僅有黑白點組成的圖像(如棋盤),一個1位模式已足夠表示一個像素。0模式表示黑像素,1模式表示白像素。然後,模式被依次記錄并存儲在計算機中。

對于多級灰階的圖像,可以通過增加位模式的長度來表示灰色級。例如,可以使用2位模式來顯示四重灰階級。黑色像素被表示成00,深灰色像素被表示成01,淺灰色像素被表示成10,白色像素被表示成11。位模式越大,能夠表示的明暗變化越細緻。

如果是表示彩色圖像,則每一種彩色像素被分解成3種主色:紅、綠和藍(rgb),然後将測出每一種顔色的強度,并用一種位模式(通常8位)配置設定給它。換句話說,每一個像素有3位模式:一個用于表示紅色的強度,一個用于表示綠色的強度,一個用于表示藍色的強度。常用的彩色模式為8位和24位。8位模式能夠提供256種可用顔色,具備一定的色彩,且檔案不是很大。24位模式又稱為真彩模式,它能夠提供1 677萬色(256×256×256=16 777 216),能夠真實展現自然的所有顔色,是顔色品質最高的格式之一。

位圖檔案的基本編碼格式為bmp(bitmap的縮寫)檔案。bmp是一種與硬體裝置無關的圖像檔案格式,使用非常廣泛。它采用位映射存儲格式,圖像深度可選l位、4位、8位及24位等模式。由于沒有采用任何壓縮技術,bmp檔案所占用的空間很大。bmp檔案存儲資料時,圖像的掃描方式是按從左到右、從下到上的順序。在有些資料中也将位圖格式稱為光栅格式。

标簽圖像檔案(tagged image file format,tiff)格式是圖像專業領域使用較廣泛的一種編碼形式,主要用來存儲照片和藝術圖等對圖像品質要求較高的平面圖像。該格式支援256色、24位真彩色、32位色、48位色等多種色彩位,同時支援rgb、cmyk以及ycbcr等多種色彩模式,支援多平台。

圖像壓縮編碼

為了存儲和傳輸資料,在保留原有内容的條件下,縮小所涉及資料的大小是有益的(有時也是必須的)。這個技術稱為資料壓縮。資料壓縮方案有兩類。一類是無損壓縮,一類是有損壓縮。無損方案在壓縮過程中是不丢失資訊的,如文本資料的壓縮。有損方案在壓縮過程中是會發生資訊丢失的。通常有損技術比無損技術提供更大的壓縮,是以在可以忽略小錯誤的資料壓縮中應用很廣泛,如圖像和音頻。

圖形壓縮編碼主要考慮到位圖檔案體積太大,對存儲和傳輸都産生很大壓力,是以人們研究通過編碼的形式,在保證圖像具備一定品質的前提下,縮小圖像檔案的大小。tiff檔案不壓縮時,檔案體積較大;同時它支援raw、rle、lzw、jpeg、ccitt3/4等多種壓縮編碼方式,可以将檔案體積壓縮到較小的尺寸。

壓縮編碼按其對圖像品質的影響可分為無損壓縮和有損壓縮兩類。所謂無損壓縮是指壓縮後圖像品質沒有下降,隻是檔案大小減小,壓縮後再需要顯示時,能夠百分之百地還原成未壓縮時的圖像狀态。有損壓縮是指在不影響圖像使用的前提下,為加大壓縮效率,盡可能減小檔案的大小,且可以接受一些圖像品質上的損失,有損壓縮後不能夠百分之百地還原。

目前最主流的圖像壓縮方式是jpeg(joint photographic experts group,聯合圖像專家組)編碼格式,檔案字尾名為“.jpg”或“.jpeg”。前面介紹過,tiff檔案也可以使用該壓縮編碼實作。jpeg壓縮技術十分先進,既能支援無損壓縮,也支援大壓縮比的有損壓縮。jpeg是一種很靈活的格式,具有調節圖像品質的功能,允許用不同的壓縮比例對檔案進行壓縮,支援多種壓縮級别,壓縮比率通常在10 : 1到40 : 1之間,壓縮比越大,品質就越低;可以根據需要在圖像品質和檔案尺寸之間找到平衡點。jpeg格式壓縮的主要是高頻資訊,對色彩的資訊保留較好,适合應用于網際網路,可減少圖像的傳輸時間。

随着高素質數位相機的普及,raw格式檔案應用越來越多。raw格式檔案被稱為數字底片(digital negative),即拍攝時從影像傳感器得到的電信号在模數轉換(a/d轉換)後,不經過其他處理而直接存儲的影像檔案格式,反映的是從影像傳感器中得到的最原始的資訊。其優點是影像品質最高,具有很大的動态範圍和很寬的色域度,很多參數可以在不影響畫質的情況下進行後期調整。其缺點是raw格式檔案占用存儲空間較大,其位元組數通常是拍攝像素數的1.5倍左右,以2 000萬像素的數位相機為例,對于同一幅照片其raw檔案大小可能會有30 mb以上,而jpeg格式的檔案通常隻有5 mb大小。另外,raw格式不同于bmp、jpeg等格式,raw的代碼中沒有頭檔案,這使得很多軟體不支援對它的讀取和編輯,通用性差。随着技術的進步,越來越多的軟體支援對raw格式的浏覽和編輯。

矢量圖

位圖圖像表示法存在的問題是,一幅特定的圖像采用精确位模式表示後,必須存儲在計算機中。随後,如果想重新調整圖像的大小,就必須改變像素的大小,這将産生波紋狀或顆粒狀的圖像。而矢量圖表示方法并不存儲位模式,它是将圖像分解成一些曲線和直線的組合,其中每一曲線或直線由數學公式表示。例如,一根直線可以通過它的端點坐标來作圖,圓則可以通過它的圓心坐标和半徑長度來作圖。這些公式的組合都被存儲在計算機中。當圖像要顯示或列印時,将圖像的尺寸作為輸入傳給系統,系統重新設計圖像的大小并用相同的公式畫出圖像。在這種情況下,每一次畫圖像,公式也将重新估算一次。

一般工程制圖軟體都使用矢量圖方式儲存,以便于按圖元的方式對圖像進行編輯。典型的格式是auto desk公司的autocad所使用的dwg格式。

1.3.3 動态資料的編碼

音頻

音頻包括各種聲音資訊形式。基本思想即将音頻轉換成數字的資料,并使用位模式存儲它們。音頻實際上是模拟量,它是連續性的,而計算機中的數字并不是連續的,需要通過一個過程将連續的音頻轉化為數字,我們稱之為采樣。采樣的具體方法是以相等的間隔來測量信号的值,并量化采樣值。采樣的時間間隔稱為采樣頻率。量化就是給采樣值配置設定值(從一個值集中),将采樣值做近似處理。具體原理大家可以參考信号處理技術中的采樣定理。

與描述靜态圖像類似,采樣頻率越高,相當于圖像分辨率越高,則音頻檔案越大;采樣量化越精細,相當于像素深度越大,音頻檔案也越大。采樣頻率一般有11 025 hz(11 khz)、22 05 0hz

(22 khz)和44 100 hz(44 khz)三種,采樣位數一般是8位或16位。音頻檔案的尺寸通常很大,在計算機中也是以壓縮編碼形式存在為主。未壓縮音頻檔案的大小可按下面的公式估算:

音頻檔案大小=(采樣頻率×量化位數×聲道)×時間/8(1 byte= 8bit)

其中,聲道是音頻檔案一個特殊之處。聲道是在空間上區分音頻來源的一種技術,通過多聲道合成技術可以形成逼真的立展現場感覺,一般話音使用單聲道就可以了,普通的音樂使用雙聲道可以産生立體聲效果,進階的方式可以使用4 ~ 6個聲道甚至8個聲道來合成高保真的立體聲環境。以單聲道為基準,多一個聲道,檔案的大小幾乎增加一倍。

音頻編碼方式也有非壓縮編碼和壓縮編碼兩類,壓縮編碼又分為有損壓縮和無損壓縮兩種。基本的音頻編碼是pcm(pulse code modulation,脈沖編碼調制)。pcm編碼的最大優點就是音質好,最大的缺點就是未壓縮導緻體積大。我們常見的audio cd就采用了pcm編碼,一張CD光牒的容量隻能容納72分鐘的音樂資訊。基本的wav檔案通常都使用pcm編碼,是以它們通常都很大。目前公認的無損音頻編碼是ape,在真正無損的前提下提供50% ~ 70%的壓縮比。

mp3(mpeg audio layer-3)是目前最為普遍的音頻壓縮編碼格式,是mpeg-1的衍生編碼方案。mp3可以做到12:1的壓縮比并保持音質基本可接受。

視訊

視訊是單幅圖像在時間上的連續表示,是典型的動态資料類型。一部電影就是一系列的幀一張接一張地播放而形成運動的圖像。動态視訊的基礎是前面讨論過的靜态單幅圖像,在這裡稱為幀。通過研究,發現幀與幀之間的圖像内容通常有很大相關性,動态視訊壓縮的基礎理論就是在單幅圖像壓縮的基礎上,再結合幀與幀之間的相關性,進行進一步壓縮。其基本思想是:如果前一幀包含的内容,下一幀可以不記錄,隻記錄與前一幀的變化即可以通過适當處理前一幀生成後一幀。顯然,這種思想對處理能力有相當高的要求。這也是為什麼視訊是在計算機硬體發展到一定程度後才大量運用的原因之一。另外,在動态圖像應用中,音頻通常是伴随進行的,現在很難想象一部沒有聲音的動畫或電影能受到歡迎。

目前最有影響的視訊編碼技術是mpeg(moving pictures experts group,動态圖像專家組),它是國際标準化組織(iso/iec)制定的技術标準。mpeg标準主要有mpeg-1、mpeg-2、mpeg-4、mpeg-7及mpeg-21等5個。mpeg标準的視訊壓縮編碼技術主要利用了具有運動補償的幀間壓縮編碼技術以減小時間備援度,利用dct技術以減小圖像的空間備援度,利用熵編碼在資訊表示方面減小了統計備援度。這幾種技術的綜合運用大大增強了壓縮性能。

随着高清視訊的發展,iso/iec與國際電聯(itu-t)聯合組建的聯合視訊組(jvt)共同制定了新數字視訊編碼标準,釋出了h.264高性能的視訊編解碼技術,iso/iec稱之為mpeg-4 avc(advanced video coding,進階視訊編碼),成為mpeg-4标準的第10部分即mpeg-4 part 10(标準号iso/iec 14496-10)。

h.264最大的優勢是具有很高的資料壓縮比率,在同等圖像品質的條件下,h.264的壓縮比是mpeg-2的兩倍以上,是mpeg-4的1.5 ~ 2倍。通常mpeg-2壓縮比為25 : 1,而h.264的壓縮比達到驚人的102 : 1!h.264是在mpeg-4技術的基礎之上建立起來的,其編解碼流程主要包括5個部分:幀間和幀内預測(estimation)、變換(transform)和反變換、量化(quantization)和反量化、環路濾波(loop filter)、熵編碼(entropy coding)。h.264/mpeg-4 avc(h.264)是最新、最有前途的視訊壓縮标準,被普遍認為是最有影響力的行業标準。它保留了以往壓縮技術的優點和精華又具有其他壓縮技術無法比拟的許多優點:

1)低碼流(low bit rate):在同等圖像品質下,采用h.264技術壓縮後的資料量隻有mpeg-2的1/8、mpeg-4的1/3。

2)高品質的圖像:h.264能提供連續、流暢的高品質圖像(dvd品質)。

3)容錯能力強:h.264有效地處理在不穩定網絡環境下容易發生的丢包等錯誤。

4)網絡适應性強:h.264提供了網絡适應層(network adaptation layer),使得h.264的檔案能容易地在不同網絡上傳輸(如網際網路、移動通信網等)。

目前,h.264最直接的應用是在網絡視訊領域,通過網際網路或無線網絡傳輸,提供高品質視訊服務,包括視訊點播、視訊會議、遠端監控等。