天天看點

視訊壓縮标準發展曆史(一)

視訊壓縮标準發展曆史 數字視訊技術廣泛應用于通信、計算機、廣播電視等領域,帶來了會議電視、可視電話及數字電視、媒體存儲等一系列應用,促使了許多視訊編碼标準的産生。ITU-T與ISO/IEC是制定視訊編碼标準的兩大組織,ITU-T的标準包括H.261、H.263、H.264,主要應用于實時視訊通信領域,如會議電視;MPEG系列标準是由ISO/IEC制定的,主要應用于視訊存儲(DVD)、廣播電視、網際網路或無線網上的流媒體等。兩個組織也共同制定了一些标準,H.262标準等同于MPEG-2的視訊編碼标準,而最新的H.264标準則被納入MPEG-4的第10部分。

視訊壓縮标準發展曆史(一)

H.26X系列壓縮标準簡介 按照ITU-T視訊編碼标準的發展過程,介紹H.261、H.263及H.264。   H.261視訊編碼标準 H.261是ITU-T為在ISDN(ISDN)上開展雙向聲像業務(可視電話、視訊會議)而制定的,速率為64kb/s的整數倍。H.261隻對CIF和QCIF兩種圖像格式進行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。 H.261是最早的運動圖像壓縮标準,它詳細制定了視訊編碼的各個部分,包括運動補償的幀間預測、DCT變換、量化、熵編碼,以及與固定速率的信道相适配的速率控制等部分。  

視訊壓縮标準發展曆史(一)

H.263視訊編碼标準 H.263是最早用于低碼率視訊編碼的ITU-T标準,随後出現的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的适用性。 H.263是ITU-T為低于64kb/s的窄帶通信信道制定的視訊編碼标準。它是在H.261基礎上發展起來的,其标準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運動補償,并增加了4種有效的壓縮編碼模式。 ========================= 技術細節介紹 ========================= 無限制的運動矢量模式允許運動矢量指向圖像以外的區域。當某一運動矢量所指的參考宏塊位于編碼圖像之外時,就用其邊緣的圖像象素值來代替。當存在跨邊界的運動時,這種模式能取得很大的編碼增益,特别是對小圖像而言。另外,這種模式包括了運動矢量範圍的擴充,允許使用更大的運動矢量,這對錄影機運動特别有利。 基于句法的算術編碼模式使用算術編碼代替霍夫曼編碼,可在信噪比和重建圖像品質相同的情況下降低碼率。 先進的預測模式允許一個宏塊中4個8×8亮度塊各對應一個運動矢量,進而提高了預測精度;兩個色度塊的運動矢量則取這4個亮度塊運動矢量的平均值。補償時,使用重疊的塊運動補償,8×8亮度塊的每個象素的補償值由3個預測值權重平均得到。使用該模式可以産生顯著的編碼增益,特别是采用重疊的塊運動補償,會減少塊效應,提高主觀品質。 PB-幀模式規定一個PB-幀包含作為一個單元進行編碼的兩幀圖像。PB-幀模式可在碼率增加不多的情況下,使幀率加倍。 ========================= 技術細節介紹 =========================   H.263視訊壓縮标準版本2 ITU-T在H.263釋出後又修訂釋出了H.263标準的版本2,非正式地命名為H.263+标準。它在保證原H.263标準核心句法和語義不變的基礎上,增加了若幹選項以提高壓縮效率或改善某方面的功能。原H.263标準限制了其應用的圖像輸入格式,僅允許5種視訊源格式。H.263+标準允許更大範圍的圖像輸入格式,自定義圖像的尺寸,進而拓寬了标準使用的範圍,使之可以處理基于視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。 為提高壓縮效率,H.263+采用先進的幀内編碼模式;增強的PB-幀模式改進了H.263的不足,增強了幀間預測的效果;去塊效應濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀品質。 為适應網絡傳輸,H.263+增加了時間分級、信噪比和空間分級,對在噪聲信道和存在大量包丢失的網絡中傳送視訊信号很有意義;另外,片結構模式、參考幀選擇模式增強了視訊傳輸的抗誤碼能力。

視訊壓縮标準發展曆史(一)

    H.263++視訊壓縮标準 H263++在H263+基礎上增加了3個選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時為了提高增強編碼效率。 這3個選項為: 選項U——稱為增強型參考幀選擇,它能夠提供增強的編碼效率和信道錯誤再生能力(特别是在包丢失的情形下),需要設計多緩沖區用于存貯多參考幀圖像。 選項V——稱為資料分片,它能夠提供增強型的抗誤碼能力(特别是在傳輸過程中本地資料被破壞的情況下),通過分離視訊碼流中DCT的系數頭和運動矢量資料,采用可逆編碼方式保護運動矢量。 選項W——在H263+的碼流中增加補充資訊,保證增強型的反向相容性,附加資訊包括:訓示采用的定點IDCT、圖像資訊和資訊類型、任意的二進制資料、文本、重複的圖像頭、交替的場訓示、稀疏的參考幀識别。 H.264視訊編碼标準    H.264視訊壓縮标準 H.264是由ISO/IEC與ITU-T組成的聯合視訊組(JVT)制定的新一代視訊壓縮編碼标準。事實上,H.264标準的開展可以追溯到8年前。1996年制定H.263标準後,ITU-T的視訊編碼專家組(VCEG)開始了兩個方面的研究:一個是短期研究計劃,在H.263基礎上增加選項(之後産生了H.263+與H.263++);另一個是長期研究計劃,制定一種新标準以支援低碼率的視訊通信。長期研究計劃産生了H.26L标準草案,在壓縮效率方面與先期的ITU-T視訊壓縮标準相比,具有明顯的優越性。2001年,ISO的MPEG組織認識到H.26L潛在的優勢,随後ISO與ITU開始組建包括來自ISO/IEC MPEG與ITU-T VCEG的聯合視訊組(JVT),JVT的主要任務就是将H.26L草案發展為一個國際性标準。于是,在ISO/IEC中該标準命名為AVC(Advanced Video Coding),作為MPEG-4标準的第10個選項;在ITU-T中正式命名為H.264标準。 H.264的主要優點如下: 在相同的重建圖像品質下,H.264比H.263+和MPEG-4(SP)減小50%碼率。 對信道時延的适應性較強,既可工作于低延遲時間模式以滿足實時業務,如會議電視等;又可工作于無時延限制的場合,如視訊存儲等。 提高網絡适應性,采用“網絡友好”的結構和文法,加強對誤碼和丢包的處理,提高解碼器的差錯恢複能力。 在編/解碼器中采用複雜度可分級設計,在圖像品質和編碼處理之間可分級,以适應不同複雜度的應用。 相對于先期的視訊壓縮标準,H.264引入了很多先進的技術,包括4×4整數變換、空域内的幀内預測、1/4象素精度的運動估計、多參考幀與多種大小塊的幀間預測技術等。新技術帶來了較高的壓縮比,同時大大提高了算法的複雜度。   ========================= 技術細節介紹 ========================= 4×4整數變換 以前的标準,如H.263或MPEG-4,都是采用8x8的DCT變換。H.26L中建議的整數變換實際上接近于4×4的DCT變換,整數的引入降低了算法的複雜度,也避免了反變換的失配問題,4×4的塊可以減小塊效應。而H.264的4×4整數變換進一步降低了算法的複雜度,相比H.26L中建議的整數變換,對于9b輸入殘差資料,由以前的32b降為現在的16b運算,而且整個變換無乘法,隻需加法和一些移位運算。新的變換對編碼的性能幾乎沒有影響,而且實際編碼略好一些。   基于空域的幀内預測技術 視訊編碼是通過去除圖像的空間與時間相關性來達到壓縮的目的。空間相關性通過有效的變換來去除,如DCT變換、H.264的整數變換;時間相關性則通過幀間預測來去除。這裡所說的變換去除空間相關性,僅僅局限在所變換的塊内,如8×8或者4×4,并沒有塊與塊之間的處理。H.263+與MPEG-4引入了幀内預測技術,在變換域中根據相臨塊對目前塊的某些系數做預測。H.264則是在空域中,利用目前塊的相臨象素直接對每個系數做預測,更有效地去除相臨塊之間的相關性,極大地提高了幀内編碼的效率。 H.264基本部分的幀内預測包括9種4×4亮度塊的預測、4種16×16亮度塊的預測和4種色度塊的預測。   運動估計 H.264的運動估計具有3個新的特點:1/4象素精度的運動估計;7種大小不同的塊進行比對;前向與後向多參考幀。 H.264在幀間編碼中,一個宏塊(16×16)可以被分為16×8、8×16、8×8的塊,而8×8的塊被稱為子宏塊,又可以分為8×4、4×8、4×4的塊。總體而言,共有7種大小不同的塊做運動估計,以找出最比對的類型。與以往标準的P幀、B幀不同,H.264采用了前向與後向多個參考幀的預測。半象素精度的運動估計比整象素運動估計有效地提高了壓縮比,而1/4象素精度的運動估計可帶來更好的壓縮效果。   編碼器中運用多種大小不同的塊進行運動估計,可節省15%以上的比特率(相對于16×16的塊)。運用1/4象素精度的運動估計,可以節省20%的碼率(相對于整象素預測)。多參考幀預測方面,假設為5個參考幀預測,相對于一個參考幀,可降低5%~10%的碼率。以上百分比都是統計資料,不同視訊因其細節特征與運動情況而有所差異。   熵編碼 H.264标準采用的熵編碼有兩種:一種是基于内容的自适應變長編碼(CAVLC)與統一的變長編碼(UVLC)結合;另一種是基于内容的自适應二進制算術編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進行目前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要複雜一些。   去塊效應濾波器 H.264标準引入了去塊效應濾波器,對塊的邊界進行濾波,濾波強度與塊的編碼模式、運動矢量及塊的系數有關。去塊效應濾波器在提高壓縮效率的同時,改善了圖像的主觀效果。 ========================= 技術細節介紹 =========================  

視訊壓縮标準發展曆史(一)

  下一篇将介紹MPEG标準的視訊壓縮格式。   參考資料: 1、 http://bbs.ednchina.com/BLOG_ARTICLE_171258.HTM 2、 http://wenku.baidu.com/view/f5901bf0f90f76c661371a4d.html