天天看點

H.264視訊壓縮編碼新方向

 JVT(Joint Video Team,視訊聯合工作組)于2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際标準化組織的有關視訊編碼的專家聯合組成。JVT的工作目标是制定一個新的視訊編碼标準,以實作視訊的高壓縮比、高圖像品質、良好的網絡适應性等目标。目前JVT的工作已被ITU-T接納,新的視訊壓縮編碼标準稱為H.264标準,該标準也被ISO接納,稱為AVC(Advanced Video Coding)标準,是MPEG-4的第10部分。

H.264标準可分為三檔:

    1. 基本檔次(其簡單版本,應用面廣);

    2. 主要檔次(采用了多項提高圖像品質和增加壓縮比的技術措施,可用于SDTV、HDTV和DVD等);

    3. 擴充檔次(可用于各種網絡的視訊流傳輸)。

    H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網絡傳輸具有更好的支援功能。它引入了面向IP包的編碼機制,有利于網絡中的分組傳輸,支援網絡中視訊的流媒體傳輸。H.264具有較強的抗誤碼特性,可适應丢包率高、幹擾嚴重的無線信道中的視訊傳輸。H.264支援不同網絡資源下的分級編碼傳輸,進而獲得平穩的圖像品質。

    H.264能适應于不同網絡中的視訊傳輸,網絡親和性好。

    (一)、H.264視訊壓縮系統 H.264标準壓縮系統由視訊編碼層(VCL)和網絡提取層(Network Abstraction Layer,NAL)兩部分組成。VCL中包括VCL編碼器與VCL解碼器,主要功能是視訊資料壓縮編碼和解碼,它包括運動補償、變換編碼、熵編碼等壓縮單元。NAL則用于為VCL提供一個與網絡無關的統一接口,它負責對視訊資料進行封裝打包後使其在網絡中傳送,它采用統一的資料格式,包括單個位元組的標頭資訊、多個位元組的視訊資料與組幀、邏輯信道信令、定時資訊、序列結束信号等。標頭中包含存儲标志和類型标志。存儲标志用于訓示目前資料不屬于被參考的幀。類型标志用于訓示圖像資料的類型。 VCL可以傳輸按目前的網絡情況調整的編碼參數。

    (二)、H.264的特點 H.264和H.261、H.263一樣,也是采用DCT變換編碼加DPCM的差分編碼,即混合編碼結構。同時,H.264在混合編碼的架構下引入了新的編碼方式,提高了編碼效率,更貼近實際應用。 H.264沒有繁瑣的選項,而是力求簡潔的“回歸基本”,它具有比H.263++更好的壓縮性能,又具有适應多種信道的能力。 H.264的應用目标廣泛,可滿足各種不同速率、不同場合的視訊應用,具有較好的抗誤碼和抗丢包的處理能力。 H.264的基本系統無需使用版權,具有開放的性質,能很好地适應IP和無線網絡的使用,這對目前網際網路傳輸多媒體資訊、移動網中傳輸寬帶資訊等都具有重要意義。盡管H.264編碼基本結構與H.261、H.263是類似的,但它在很多環節做了改進,現列舉如下。

    1.多種更好的運動估計 高精度估計 在H.263中采用了半像素估計,在H.264中則進一步采用1/4像素甚至1/8像素的運動估計。即真正的運動矢量的位移可能是以1/4甚至1/8像素為基本機關的。顯然,運動矢量位移的精度越高,則幀間剩餘誤差越小,傳輸碼率越低,即壓縮比越高。 在H.264中采用了6階FIR濾波器的内插獲得1/2像素位置的值。當1/2像素值獲得後, 1/4像素值可通過線性内插獲得。 對于4:1:1的視訊格式,亮度信号的1/4 像素精度對應于色度部分的1/8像素的運動矢量,是以需要對色度信号進行1/8像素的内插運算。 理論上,如果将運動補償的精度增加一倍(例如從整像素精度提高到1/2像素精度),可有0.5bit/Sample的編碼增益,但實際驗證發現在運動矢量精度超過1/8像素後,系統基本上就沒有明顯增益了,是以,在H.264中,隻采用了1/4像素精度的運動矢量模式,而不是采用1/8像素的精度。 多宏塊劃分模式估計 在H.264的預測模式中,一個宏塊(MB)可劃分成7種不同模式的尺寸,這種多模式的靈活、細微的宏塊劃分,更切合圖像中的實際運動物體的形狀,于是,在每個宏塊中可包含有1、2、4、8或16個運動矢量。 多參數幀估計 在H.264中,可采用多個參數幀的運動估計,即在編碼器的緩存中存有多個剛剛編碼好的參數幀,編碼器從其中選擇一個給出更好的編碼效果的作為參數幀,并指出是哪個幀被用于預測,這樣就可獲得比隻用上一個剛編碼好的幀作為預測幀的更好的編碼效果。

    2.四的整數變換(小尺寸4) 4塊,由于變換塊的尺寸變小了,運動物體的劃分就更為精确。這種情況下,圖像變換過程中的計算量小了,而且在運動物體邊緣的銜接誤差也大為減少。?8塊。在H.264中卻采用小尺寸的4?視訊壓縮編碼中以往的常用機關為8 2塊的變換。?4塊的DC系數(每個小塊一個,共4個DC系數)進行2?4塊的變換,對色度資料的4個4?4塊的DCT系數進行第二次4?當圖像中有較大面積的平滑區域時,為了不産生因小尺寸變換帶來的塊間灰階差異,H.264可對幀内宏塊亮度資料的16個4 H.263不僅使圖像變換塊尺寸變小,而且這個變換是整數操作,而不是實數運算,即編碼器和解碼器的變換和反變換的精度相同,沒有“反變換誤差”。

    3.更精确的幀内預測 4塊中的每個像素都可用17個最接近先前已編碼的像素的不同權重和來進行幀内預測。? 在H.264中,每個4     4.統一的VLC H.264中關于熵編碼有兩種方法。 統一的VLC(即UVLC:Universal VLC)。UVLC使用一個相同的碼表進行編碼,而解碼器很容易識别碼字的字首,UVLC在發生比特錯誤時能快速獲得重同步。 内容自适應二進制算術編碼,CABAC:Context Adaptive Binary Arithmetic Coding)。其編碼性能比UVLC稍好,但複雜度較高。

    (三)、性能優勢 H.264與MPEG-4、H.263++編碼性能對比采用了以下6個測試速率:32kbit/s、10F/s和QCIF;64kbit/s、15F/s和QCIF;128kbit/s、15F/s和CIF;256kbit/s、15F/s和QCIF;512kbit/s、30F/s和CIF;1024kbit/s、30F/s和CIF。測試結果标明,H.264具有比MPEG和H.263++更優秀的PSNR性能。 H.264的 PSNR比MPEG-4平均要高2dB,比H.263++平均要高3dB。

    (四)、新的快速運動估值算法 新的快速運動估值算法UMHexagonS(中國專利)是一種運算量相對于H.264中原有的快速全搜尋算法可節約90%以上的新算法,全名叫“非對稱十字型多層次六邊形格點搜尋算法”(Unsymmetrical-Cross Muti-Hexagon Search)”,這是一種整像素運動估值算法。由于它在高碼率大運動圖像序列編碼時,在保持較好率失真性能的條件下,運算量十分低,已被H.264标準正式采納。 ITU和 ISO合作發展的 H.264(MPEG-4 Part 10)有可能被廣播、通信和存儲媒體(CD DVD)接受成為統一的标準,最有可能成為寬帶互動新媒體的标準。我國的信源編碼标準尚未制定,密切關注H.264的發展,制定我國的信源編碼标準的工作正在加緊進行。 H264标準使運動圖像壓縮技術上升到了一個更高的階段,在較低帶寬上提供高品質的圖像傳輸是H.264的應用亮點。H.264的推廣應用對視訊終端、網守、網關、MCU等系統的要求較高,将有力地推動視訊會議軟、硬體裝置在各個方面的不斷完善。

本文轉自 fanxiaojun 51CTO部落格,原文連結:http://blog.51cto.com/2343338/411995,如需轉載請自行聯系原作者

繼續閱讀