天天看點

H.264/AVC是什麼?網絡錄影機四種圖像編碼格式MPEG4壓縮技術

http://www.skyvio.com/htm/2007-05/33.htm

H.264/AVC标準是由ITU-T和ISO/IEC聯合開發的,定位于覆寫整個視訊應用領域,包括:低碼率的無線應用、标準清晰度和高清晰度的電視廣播應用、Internet上的視訊流應用,傳輸高清晰度的DVD視訊以及應用于數位相機的高品質視訊應用等等。

ITU-T給這個标準命名為H.264(以前叫做H.26L),而ISO/IEC稱它為MPEG-4 進階視訊編碼(Advanced Video Coding,AVC),并且它将成為MPEG-4标準的第10部分。既然AVC是目前MPEG-4标準的拓展,那麼它必然将受益于MPEG-4開發良好的基礎結構(比如系統分層和音頻等)。很明顯,作為MPEG-4進階簡潔架構(Advanced Simple Profile,ASP)的MPEG-4 AVC将會優于目前的MPEG-4視訊壓縮标準,它将主要應用在具有高壓縮率和分層次品質需求的方向。

就像在下邊“視訊編碼曆史”表格中看到的,ITU-T和ISO/IEC負責以前所有的國際視訊壓縮标準的定制。到目前為止,最成功的視訊标準是MPEG-2,它已經被各種市場領域所廣泛接受比如DVD、數字電視廣播(覆寫電纜和通訊衛星)和數字機頂盒。自從MPEG-2技術産生以來,新的H.264/MPEG-4 AVC标準在編碼效率和品質上有了巨大的提高。随着時間的過去,在許多現有的應用領域,H.264/MPEG-4 AVC将會取代MPEG-2和MPEG-4,包括一些新興的市場(比如ADSL視訊)。

數字視訊編解碼技術的演變

  國際标準通常是由國際标準化組織ISO在國際電信聯盟 ITU的技術建議的基礎上制訂的。數字視訊編解碼标準也經曆了多次變革,H264标準使運動圖像壓縮技術上升到了一個更高的階段,在較低帶寬上提供高品質的圖像傳輸是H.264的應用亮點。H.264的推廣應用對視訊終端、網守、網關、MCU等系統的要求較高,将有力地推動視訊會議軟裝置在各個方面的不斷完善。

H.264的核心競争力

  H.264最具價值的部分無疑是更高的資料壓縮比。壓縮技術的基本原理就是将視訊檔案中的非重要資訊過濾,以便讓資料能夠更快地在網絡中傳輸。在同等的圖像品質條件下,H.264的資料壓縮比能比目前DVD系統中使用的MPEG-2高2-3倍,比MPEG-4高1.5-2倍。正因為如此,經過H.264壓縮的視訊資料,在網絡傳輸過程中所需要的帶寬更少,也更加經濟。

在MPEG-4需要6Mbps的傳輸速率比對時,H.264隻需要3Mbps-4Mbps的傳輸速率。我們用交通運輸來做更加形象的比喻:同樣是用一輛卡車運輸一個大箱子,假如MPEG-4能把箱子減重一半,那麼H.264能把箱子減重為原來的1/4,在卡車載重量不變的情況下,H.264比MPEG-2讓卡車的載貨量增加了二倍。

H.264獲得優越性能的代價是計算複雜度的大幅增加,例如分層設計、多幀參論、多模式運動估計、改進的幀内預測等,這些都顯著提高了預測精度,進而獲得比其他标準好得多的壓縮性能。

不斷提高的硬體處理能力和不斷優化的軟體算法是H.264得以風行的生存基礎。早在十年前,主頻為幾十兆的CPU就達到了頂級,而如今普通的桌上型電腦,CPU的主頻已經高達幾千兆。按照摩爾定律的說法,晶片機關面積的容量每18個月翻一番,是以H.264所增加的運算複雜度相對于性能提升效果而言微不足道。更何況新的計算方法層出不窮,也相對緩解H.264對處理速度的饑渴需求。

H.264 與MPEG-4的比較

1、在極低碼率(32-128Kbps)的情況下,H.264與MPEG-4相比具有性能倍增效應,即: 相同碼率的H.26L媒體流和MPEG-4媒體流相比,H.26L擁有大約3個分貝的增益(畫質水準倍增)。 32Kbps的H.26L媒體流,其信躁比與128K的MPEG-4媒體流相近。即在同樣的畫面品質下,H.264的碼率僅僅為MPEG-4的四分之一。

2、 H.26L在中低碼率下與MPEG-4比較:在中低碼率(32-128Kbps)的情況下,H.26L與MPEG-4相比具有性能倍增效應。

3、H.264與MPEG-4的畫面效果比較

下圖左為MPEG-4在碼率為1Mbps情況下的畫面品質,右為H.26L在碼率為512Kbps情況下的畫面品質。同樣展現了H.26L的性能倍增。

H.264标準推出僅一年,大部分宣傳支援H.264的終端廠商主要都是支援H.264的基本檔次。因為H.264編解碼複雜度的增加,對終端廠商的視訊處理能力提出了挑戰。現有的平台,要麼就根本無法做H.264的編解碼,要麼就不能支援高碼率下的編解碼。而泰和視訊會議産品最大支援640*480,視訊标準采用最新的高碼率編解碼技術,圖像清晰流暢。在帶寬節約39%的基礎上視訊品質的信噪比要比同類産品高出40%,是目前視訊品質最好的編碼技術。

下面我們深入探讨一下H.264/AVC核心技術。

H.264/AVC核心技術概覽

就像在圖中看到的一樣,這個新的标準是由下面幾個處理步驟組成的:

   幀間和幀内預測

   變換(和反變換)

   量化(和反量化)

   環路濾波

   熵編碼

單張的圖檔流組成了視訊,它能分成16X16像素的“宏塊”,這種分塊方法簡化了在視訊壓縮算法中每個步驟的處理過程。舉例來說,從标準清晰度标準視訊流解決方案(720X480)中截取的一幅圖檔被分成1350(45X30)個宏塊,然後在宏塊的層次進行進一步的處理。

幀間預測

改良的運動估計。運動估計用來确定和消除存在于視訊流中不同圖檔之間的時間備援。當運動估計搜尋是根據過去方向的圖檔,那麼被編碼的圖檔稱為“P幀圖檔”,當搜尋是根據過去和将來兩種方向的圖檔,那麼被編碼的圖檔被稱為“B幀圖檔”。

為了提高編碼效率,為了包含和分離在“H.264運動估計-改良的運動估計”圖中的運動宏塊,宏塊被拆分成更小的塊。然後,以前或将來的圖檔的運動矢量被用來預測一個給定的塊。H.264/MPEG-4 AVC發明了一種更小的塊,它具有更好的靈活性,在運動矢量方面可以有更高的預測精度。

H.264運動估計-改良的運動估計

幀内預測

不能運用運動估計的地方,就采用幀内估計用來消除空間備援。内部估計通過在一個預定義好的集合中不同方向上的鄰近塊推測相鄰像素來預測目前塊。然後預測塊和真實塊之間的不同點被編碼。這種方法是H.264/MPEG-4 AVC所特有的,尤其對于經常存在空間備援的平坦背景特别有用。一個例子就是下邊展示的“H.264内部估計”。

H.264内部估計

變換 運動估計和内部估計後的結果通過變換被從空間域轉換到頻率域。H.264/MPEG-4 AVC使用整數DCT4X4變換。而MPEG-2和MPEG-4使用浮點DCT8X8變換。

更小塊的H.264/MPEG-4 AVC減少了塊效應和明顯的人工痕迹。整數系數消除了在MPEG-2和MPEG-4中進行浮點系數運算時導緻的精度損失。

H.264變換

量化 變換後的系數被量化,減少了整數系數的預測量和消除了不容易被感覺高頻系數。這個步驟也用來控制輸出的比特率維持在一個基本恒定的常量。

H.264量化/碼率控制

環路濾波 H.264/MPEG-4 AVC标準定義了一個對16X16宏塊和4X4塊邊界的解塊過濾過程。在宏塊這種情況下,過濾的目的是消除由于相鄰宏塊有不同的運動估計類型(比如運動估計和内部估計)或者不同的量化參數導緻的人工痕迹。在塊邊界這種情況下,過濾的目的是消除可能由于變換/量化和來自于相鄰塊運動矢量的差别引起的人工痕迹。環路濾波通過一個内容自适應的非線性算法修改在宏塊/塊邊界的同一邊的兩個像素。

熵編碼 在熵編碼之前,4X4的量化系數必須被重排序。根據這些系數原來采用的預測算法為運動估計或者内部估計的不同來選擇不同的掃描類型建立一個重排序的串行化流。掃描類型按照從低頻到高頻的順序排序這些系數。既然高頻系數大多數趨向于零,那麼利用遊程編碼就可以縮減零的數目,進而高效的達到熵編碼的目的。

H.264熵編碼-系數的串行化

在熵編碼步驟通過映射符号的位元組流來表示運動矢量,量化系數和宏塊頭。熵編碼通過設計用一個較少的比特位數來表示頻繁使用的符号,比較多的比特位數來表示不經常使用的符号。

網絡錄影機四種圖像編碼格式

http://www.skyvio.com/htm/2007-05/32.htm

MPEG4

所謂MPEG标準就是指由ISO的活動圖像專家組制定的一系列關于音視訊信号以及多媒體信号的壓縮與解壓縮技術的标準。到目前為止,已經制定完成并準許執行的有:1991年準許的MPEG1、MP3;1994年準許的MPEG2;1999年準許的MPEG4和MP4。正在制定的标準有:MPEG7和MEPG21. 

H.263

H.263是ITU-T提出的作為H.324終端使用的視訊編解碼建議,H.263經過不斷地完善和多次的更新已經日臻成熟,如今已經大部分代替了H.261,而且H.263由于能在低帶寬上傳輸高品質的視訊流而日益受到歡迎。

H.263是基于運動補償的DPCM的混合編碼,在運動補償的DPCM混合編碼,在運動搜尋的基礎上進行運動補償,然後運用DCT變換和“之”字形掃描編碼,進而得到輸出碼流。H.263在H.261建議的基礎上,将運動矢量的搜尋增加為半象素點搜尋;同時又增加了無限制運動矢量、基于文法的算術編碼、進階預測技術和PB幀編碼等四個進階選項;進而達到了進一步降低碼速率和提高編碼品質的目的。

H.264

H.264是ITU-T的VCEG和ISO/IEC的MPEG的聯合視訊組開發的一個新的數字視訊編碼标準,它既是ITU-T的H.264,又是ISO/IEC的MPEG4的第十部分。  

在相同的重建圖像品質下,H.264能夠比H.263節約50%左右的碼率,比目前根據MPEG4實作的視訊格式在性能方面提高33%左右。

M-JPEG

M-JPEG技術即運動靜止圖像壓縮技術,它把運動的視訊序列作為連續的靜止圖像來處理,這種壓縮技術方式單獨完整地壓縮每一幀,在編輯過程中可随機存儲每一幀,可進行精确到幀地編輯。但M-JPEG隻對幀内地空間備援進行壓縮,不對幀間的時間備援進行壓縮,故壓縮效率不高。

MPEG4壓縮技術

 MPEG-4于1998年11月公布,預計投入使用的國際标準MPEG-4是針對一定比特率下的視訊、音頻編碼,更加注重多媒體系統的互動性和靈活性。與MPEG-1和MPEG-2相比,MPEG-4更适于互動AV服務以及遠端監控,它的設計目标使其具有更廣的适應性和可擴充性;MPEG-4傳輸速率在4800-6400bps之間,分辨率為176×144dpi,可以利用很窄的帶寬通過幀重建技術壓縮和傳輸資料,進而能以最少的資料獲得最佳的圖像品質。是以,它将在數字電視、動态圖像、網際網路、實時多媒體監控、移動多媒體通信、Internet/intranet上的視訊流與可視遊戲、DVD上的互動多媒體應用等方面大顯身手。

當然,對于普通使用者來說, MPEG-4在目前來說最有吸引力的地方還在于它能在普通 CD-ROM上基本實作 DVD的品質;用 MPEG-4壓縮算法的 ASF(Advanced Streaming format,進階格式流 )可以将 120分鐘的電影壓縮為 300MB左右的視訊流;采用 MPEG-4壓縮算法的 DIVX視訊編碼技術可以将 120分鐘的電影壓縮 600MB左右,也可以将一部 DVD影片壓縮到 2張 CD-ROM上!也就是說,有了 MPEG-4,你不需要購買 DVD-ROM就可以享受到和它差不多的視訊品質!播放這種編碼的影片對機器的要求并不高:隻要你的電腦有 300MHz以上 (無論是哪種型号 )的 CPU、 64MB記憶體、 8MB的顯示卡就可以流暢地播放。

繼續閱讀