天天看點

H.264視訊壓縮标準拓展視訊監控的潛力

 1.簡介

    H.264是最新的視訊壓縮标準,它也稱為MPEG-4Part10或AVC(進階視訊編碼)。據預測,在未來幾年内H.264将成為行業首選的視訊标準

    H.264是一個需要許可證才能使用的開放标準,可支援最當今市場上最高效的視訊壓縮技術。在不影響圖像品質的情況下,與采用M-JPEG和MPEG-4Part2标準相比,H.264編碼器可使數字視訊檔案的大小分别減少80%和50%以上。這意味着視訊檔案所需的網絡帶寬和存儲空間将大大降低。或者從另一個角度來說,在某一特定比特率下,視訊圖像品質将得到顯著提高。

    H.264由電信和IT行業的标準化組織聯合制定,與先前标準相比,H.264有望得到更廣泛的應用。

    H.264已經應用于手機和數字視訊播放器等新一代電子産品中,并且迅速獲得廣大最終使用者的青睐。線上視訊存儲公司和電信公司等服務提供商也開始采用H.264标準。

    在視訊監控行業,H.264将很可能以最快速度應用于那些需要高幀速和高分辨率的監控場所,例如高速公路、機場和娛樂場所等。對于這些監控場所而言,使用30/25fps(NTSC/PAL)的幀速已經成為一種通行的标準。然而,由于H.264能夠減少帶寬和存儲需求,具有顯著的經濟性,是以可以幫助企業最大限度節省成本。

    此外,由于H.264這種極其高效的壓縮技術能夠在不影響圖像品質的前提下,對大檔案進行大比例壓縮并降低比特率,是以有望提高百萬像素錄影機的普及速度。然而,事物都有其兩面性。雖然H.264能夠節省網絡帶寬和存儲成本,然而它卻對網絡錄影機和顯示終端提出了更高的性能要求。

    2.H.264的發展

    H.264是ITU-T的視訊編碼專家組(VCEG)和ISO/IEC運動圖像專家組(MPEG)聯合制定的新一代視訊壓縮标準。ITU-T是一個代表國際電信聯盟協調制定電信标準的部門。ISO是指國際标準化組織。IEC是指國際電工委員會,負責制定所有電子、電氣和相關技術的标準。H.264是ITU-T所使用的名稱,而ISO/IEC将其命名為MPEG-4Part10/AVC,因為它代表的是MPEG-4系列标準中的一個新标準。MPEG-4系列标準包括了MPEG-4Part2等标準,MPEG-4Part2是一個應用于基于IP的視訊編碼器和網絡錄影機的标準。

    為了解決先前視訊壓縮标準中存在的不足,H.264的目标是支援:

    >高效壓縮,在某一特定的視訊品質下,與采用任何其它視訊标準相比,可以使比特率平均降低50%。

    >更強大的容錯能力,能夠糾正各種網絡的傳輸錯誤

    >低延遲時間功能,并能夠在更高時延的情況下提供更高品質的圖像

    >通過簡單的句法規範簡化實施

    >精确比對解碼,嚴格規定了編碼器和解碼器如何進行數值計算,以避免錯誤累積

    此外,H.264還能夠靈活地支援有着不同比特率要求的各種監控應用。例如,在娛樂視訊應用(包括廣播、衛星電視、有線電視和DVD)中,H.264能夠以高時延實作1-10Mbit/秒的性能。而對于電信服務來說,H.264能夠以低延遲時間實作低于1Mbit/秒的比特率。

    3.視訊壓縮的工作原理

    視訊壓縮通過減少和去除備援視訊資料的方式,達到有效發送和存儲數字視訊檔案的目的。在壓縮過程中,需要應用壓縮算法對源視訊進行壓縮以建立壓縮檔案,以便進行傳輸和存儲。要想播放壓縮檔案,則需要應用相反的解壓縮算法對視訊進行還原,還原後的視訊内容與原始的源視訊内容幾乎完全相同。壓縮、發送、解壓縮和顯示檔案所需的時間稱為延時。在相同處理能力下,壓縮算法越進階,延時就越長。

    視訊編解碼器(編碼器/解碼器)是指兩個協同運作的壓縮-解壓算法。使用不同标準的視訊編解碼器通常彼此之間互不相容;也就是說,使用一種标準進行壓縮的視訊内容無法使用另外一種标準進行解壓縮。例如,MPEG-4Part2解碼器就不能與H.264編碼器協同運作。這是因為一種算法無法正确地對另外一個算法的輸出信号進行解碼,然而我們可以在同一軟體或硬體中使用多種不同的算法,以支援對多種格式的檔案進行壓縮。

    由于不同的視訊壓縮标準會使用不同的方法來減少資料量,是以壓縮結果在比特率、品質和延時方面也各不相同。

    此外,由于編碼器的設計者可能會選擇使用某個标準所定義的不同工具集,是以,即使是使用相同壓縮标準的編碼器之間,其壓縮結果也可能會存在差異。不過,隻要編碼器的輸出信号符合标準的格式以及解碼器的要求,就可以采用不同的實施方式。這是非常有利的,因為不同的實施方式可實作不同的目标,滿足不同的預算要求。對用于管理光媒體存儲的非實時專業軟體編碼器來說,應該能夠比用于視訊會議的內建在手持裝置中的實時硬體編碼器提供品質更高的編碼視訊。是以,即使是某個指定的标準也無法保證提供指定的比特率或品質。而且,如果不事先确定實施方式,一個标準就無法與其它标準進行正确的性能對比,甚至也無法與同一标準的其它實施方式進行正确的性能對比。

    與編碼器不同,解碼器必須實施某個标準的所有必需部分,才能對符合标準的比特流進行解碼。這是因為标準中明确規定了解壓縮算法應如何對壓縮視訊的每個比特進行還原。

    下圖是在相同圖像品質水準下,采用下列視訊标準的比特率對比:M-JPEG,MPEG-4Part2(無運動補償)、MPEG-4Part2(有運動補償)和H.264(基準類)。

H.264視訊壓縮标準拓展視訊監控的潛力

圖1.對于視訊序列樣本來說,使用H.264編碼器能夠比使用有運動補償的MPEG-4編碼器降低50%的比特率(bps)。在沒有運動補償的情況下,H.264編碼器的效率至少比MPEG-4編碼器高3倍,比M-JPEG編碼器高6倍。

點選此處檢視全部新聞圖檔

上圖文字:

Doorway scene 入口場景
H.264 (Baseline profile) H.264(基線類)
MPEG-4 Part 2 (With motion compensation) MPEG-4 Part 2(有運動補償)
MPEG-4 Part 2 (No motion compensation) MPEG-4 Part 2(無運動補償)
Motion JPEG M-JPEG
Bit rate (kbit/s) 比特率(kbit/秒)
Time (s) 時間(秒)

4.H.264類别和等級

    參與制定H.264标準的聯合組織緻力于建立一個簡單明了的解決方案,最大限度地限制選項和特性的數量。和其它視訊标準一樣,H.264标準的一個重要方面是通過類别(算法特性集)和等級(性能等級)中提供的功能,以最佳的方式支援常見應用和通用格式。

    H.264有7個類别,每個類别都針對某一類特定的應用。此外,每個類别都定義了編碼器能夠使用哪些特性集,并限制了解碼器在實施方面的複雜性。

    網絡錄影機和視訊編碼器最有可能使用的是基準類别,此類别主要針對計算資源有限的應用。對于嵌入在網絡視訊産品中的實時編碼器來說,在特定的可用性能下,基準類别最為适用。此類别能夠實作低延時,這對監控視訊來說是一個很重要的要求,而且對于支援PTZ網絡錄影機實作實時的平移/傾斜/縮放(PTZ)控制來說尤為重要。

    H.264分為11個功能等級,對性能、帶寬和記憶體需求進行了限制。每個等級都規定了從QCIF到HDTV等各種分辨率所對應的比特率和編碼速率(每秒宏塊數)。分辨率越高,要求的等級就越高。

    5.幀的基本知識

    根據H.264的不同類别,編碼器會使用不同類型的幀,例如I幀、P幀和B幀。

    I幀(幀内編碼幀)是一種自帶全部資訊的獨立幀,無需參考其它圖像便可獨立進行解碼。視訊序列中的第一個幀始終都是I幀。如果所傳輸的比特流遭到破壞,則需要将I幀用作新檢視器的起始點或重新同步點。I幀可以用來實作快進、快退以及其它随機通路功能。如果新的用戶端将參與檢視視訊流,編碼器将以相同的時間間隔或者根據要求自動插入I幀。I幀的缺點在于它們會占用更多的資料位,但從另一方面看,I幀不會産生可覺察的模糊現象。

    P幀(幀間預測編碼幀)需要參考前面的I幀和/或P幀的不同部分才能進行編碼。與I幀相比,P幀通常占用更少的資料位,但其缺點是,由于P幀對前面的P和I參考幀有着複雜的依賴性,是以對傳輸錯誤非常敏感。

    B幀(雙向預測編碼幀)需要同時以前面的幀和後面的幀作為參考幀。

H.264視訊壓縮标準拓展視訊監控的潛力

圖2.帶有I幀、B幀和P幀的典型視訊序列。P幀隻需要參考前面的I幀或P幀,而B幀則需要同時參考前面和後面的I幀或P幀。

點選此處檢視全部新聞圖檔

    當視訊解碼器逐個幀地對比特流進行解碼以便重構視訊時,必須始終從I幀開始解碼。如果使用了P幀和B幀,則必須與參考幀一起解碼。

    在H.264基準類中,僅使用I幀和P幀。由于基準類沒有使用B幀,是以可以實作低延時,是以是網絡錄影機和視訊編碼器的理想選擇。

    6.減少資料量的基本方法

    可以通過各種方法在一個圖像幀内或者在一系列幀之間減少視訊資料量。

    在某個圖像幀内,隻需要删除不必要的資訊就可以減少資料量,但這樣做會導緻圖像的分辨率下降。

    在一系列的幀内,可以通過差分編碼這樣的方法來減少視訊資料量,包括H.264在内的大多數視訊壓縮标準都采用這種方法。在差分編碼中,會将一個幀與參考幀(即前面的I幀或P幀)進行對比,然後隻對那些相對于參考幀來說發生了變化的像素進行編碼。通過這種方法,可以降低需要進行編碼和發送的像素值。

H.264視訊壓縮标準拓展視訊監控的潛力

圖3.對M-JPEG格式來說,上述序列中的三個圖像分别作為獨立的圖像(I幀)進行編碼和發送,彼此之間互不依賴。

點選此處檢視全部新聞圖檔

H.264視訊壓縮标準拓展視訊監控的潛力

圖4.對差分編碼(包括H.264在内的大多數視訊壓縮标準都采用這種方法)來說,隻有第一個圖像(I幀)是将全幀圖像資訊進行編碼。

點選此處檢視全部新聞圖檔

    如果是根據像素塊(宏塊)而不是單個的像素來檢測差别并進行差分編碼,還可以進一步減少需要編碼的資訊量;是以,可以對更大的區域進行對比,而隻需對那些存在重大差别的塊進行編碼。此外,對發生更改的區域位置進行标記的相關開銷也将大大降低。

    然而,如果視訊中存在大量物體運動的話,差分編碼将無法顯著減少資料量。這時,可以采用基于塊的運動補償技術。基于塊的運動補償考慮到視訊序列中構成新幀的大量資訊都可以在前面的幀中找到,但可能會在不同的位置上。是以,這種技術将一個幀分為一系列的宏塊。然後,通過在參考幀中查找比對塊的方式,逐塊地建構或者“預測”一個新幀(例如P幀)。如果發現比對的塊,編碼器隻需要對參考幀中發現比對塊的位置進行編碼。與對塊的實際内容進行編碼相比,隻對運動矢量進行編碼可以減少所占用的資料位。

H.264視訊壓縮标準拓展視訊監控的潛力

圖5.基于塊的運動補償圖示

點選此處檢視全部新聞圖檔

上圖文字:

Search window 搜尋視窗
Matching block 比對塊
Motion vector 運動矢量
Target block 目标塊
Earlier reference frame 前面的參考幀
P-frame P幀

7.H.264的效率

    H.264将視訊壓縮技術提升到一個新的高度。在H.264中,将通過新的進階幀内預測方法對I幀進行編碼。這種方法通過對幀中每個宏塊内較小的像素塊進行連續預測,可以大大減少I幀所占的資料位并保持較高的品質。這一點可通過在與進行幀内編碼的新4×4像素塊相鄰接的前幾個編碼像素中,尋找比對的像素來實作。通過重複利用已編碼的像素值,可以極大地減少需要編碼的位數。新的幀内預測功能是H.264技術的關鍵部分,實驗證明,這種方法非常有效。與隻使用I幀的M-JPEG視訊流相比,隻使用I幀的H.264視訊流的檔案大小要小得多。

H.264視訊壓縮标準拓展視訊監控的潛力

圖6.在由16個像素塊構成的宏塊中,對其中1個像素塊内的4×4像素進行編碼時,幀内預測所采用的幾種模式的圖示。在宏塊的16個像素塊中,每個像素塊都可以使用不同的模式進行編碼。

點選此處檢視全部新聞圖檔

     上圖文字:

In this mode, four bottom pixels from the block above are copied vertically into part of an intra-coded macroblock. 在這種模式中,上方像素塊中的四個底部像素被垂直拷貝至經過幀内編碼的宏塊中。
In this mode, four right-most pixels from the block to the left are copied horizontally into part of an intra-coded macroblock. 在這種模式中,左邊像素塊中的最右側四個像素被水準拷貝至經過幀内編碼的宏塊中。
In this mode, eight bottom pixels from the blocks above are copied diagonally into part of an intra-coded macroblock. 在這種模式中,上方像素塊中的八個底部像素被沿對角線方向拷貝至經過幀内編碼的宏塊中。
H.264視訊壓縮标準拓展視訊監控的潛力

圖7.以上是H.264幀内預測方法的效率圖示。通過這種方法,幀内預測圖像将“免費”發送。隻需對殘留圖像和幀内預測模式進行編碼,就可以生成輸出圖像。

 點選此處檢視全部新聞圖檔

    對P幀和B幀進行編碼時所采用的基于塊的運動補償,在H.264中也得到了改進。H.264編碼器可以在一個或多個參考幀的少數或衆多區域内,以低至子像素的精度搜尋比對的塊。為了提高比對率,可以對塊的大小和形狀進行調整。在參考幀中,對于找不到比對塊的區域,将會使用幀内編碼的宏塊。H.264基于塊的運動補償具有高度的靈活性,非常适合人群比較擁擠的監控場所,因為它能夠保證較高的品質,以滿足嚴格的應用要求。運動補償是視訊編碼器要求最嚴格的一個方面,H.264編碼器實施運動補償的不同方式以及其實施程度,将會影響視訊壓縮的效率。

    對于H.264,通過使用環内去塊效應濾波器,可以減少在使用M-JPEG和MPEG标準(而不是H.264标準)的高度壓縮視訊中通常出現的圖像模糊現象。此過濾器能夠通過自适應強度使塊邊緣變得平滑,進而確定輸出幾乎完美無缺的解壓縮視訊。

H.264視訊壓縮标準拓展視訊監控的潛力

圖8.從右邊的圖中我們可以看到,在應用了去塊效應濾波器之後,左圖中高度壓縮圖像的塊狀效應已經大大降低。

點選此處檢視全部新聞圖檔

    8.結論

    H.264代表着視訊壓縮技術的一個重大飛躍。由于該技術具有更精确的預測能力和更高的容錯能力,是以可實作更高的壓縮效率。它将有可能推動視訊編碼器進一步向前發展,進而能夠在同樣的比特率下提供更高品質的視訊流、更高的幀速以及更高的分辨率(與先前的标準相比);或者反過來說,能夠在同樣的視訊品質下降低比特率。

    H.264是ITU、ISO和IEC首次在視訊壓縮方面聯合制定的一個通用國際标準。由于其具有高度的靈活性,H.264已廣泛應用于各種領域中,例如:高清DVD(例如藍光)、數字視訊廣播(包括高清TV)、線上視訊存儲(例如YouTube)、3G行動電話、軟體(例如QuickTime、Flash和蘋果計算機公司的MacOSX作業系統等),以及家用電視遊戲機(例如PlayStation3等)。在衆多行業的支援下,以及在為滿足個人消費者和專業使用者需求的應用的推動下,H.264有望取代當今市場中使用的其它壓縮标準和方法。

    随着H.264格式更加廣泛地應用于網絡錄影機、視訊編碼器和視訊管理軟體,系統設計商和內建商将需要確定他們所選擇的産品和廠商能夠支援這一全新的開放标準。就目前來說,能夠同時支援H.264和M-JPEG的網絡視訊産品具有最高的靈活性和內建能力,是以是使用者的理想選擇。

繼續閱讀