AVS(Audio Video coding Standard)即數字音視訊編解碼技術标準,為中國第二代信源編碼标準,此編碼技術主要解決數字音視訊海量資料(即初始資料、信源)的編碼壓縮問題,故也稱數字音視訊編解碼技術。
AVS工作組即數字音視訊編解碼技術标準工作組(Audio Video coding Standard Workgroup of China)由國家原資訊産業部科學技術司于2002年6月準許成立。工作組的任務是:面向我國的資訊産業需求,聯合國内企業和科研機構,制(修)訂數字音視訊的壓縮、解壓縮、處理和表示等共性技術标準,為數字音視訊裝置與系統提供高效經濟的編解碼技術,服務于高分辨率數字廣播、高密度雷射數字存儲媒體、無線寬帶多媒體通訊、網際網路寬帶流媒體等重大資訊産業應用。自AVS工作組2002年成立以來,至今,已制定了兩代AVS标準。
AVS标準工作簡況與進展:AVS是我國具備自主知識産權的第二代信源編碼标準。顧名思義,”信源”是資訊的”源頭”,信源編碼技術解決的重點問題是數字音視訊海量資料(即初始資料、信源)的編碼壓縮問題,故也稱數字音視訊編解碼技術。顯而易見,它是其後數字資訊傳輸、存儲、播放等環節的前提,是以是數字音視訊産業的共性基礎标準。
國際上音視訊編解碼标準主要兩大系列:ISO/IEC JTC1制定的MPEG系列标準;ITU針對多媒體通信制定的H.26x系列視訊編碼标準和G.7系列音頻編碼标準。1994年由MPEG和ITU合作制定的MPEG-2是第一代音視訊編解碼标準的代表,也是目前國際上最為通行的音視訊标準。
經過十年多演變,音視訊編碼技術本身和産業應用背景都發生了明顯變化,後起之秀輩出。目前音視訊産業可以選擇的信源編碼标準有五個:MPEG-2、MPEG-4、MPEG-4 AVC(簡稱AVC,也稱JVT、H.264)、HEVC、AVS。從制訂者分,前四個标準是由MPEG專家組完成的,第五個是我國自主制定的。從發展階段分,MPEG-2是第一代信源标準,其餘四個為第二代标準。從主要技術名額----編碼效率比較:MPEG-4是MPEG-2的1.4倍,第一代AVS和AVC相當,都是MPEG-2兩倍以上。第二代AVS2編碼效率比第一代标準提高了一倍以上,壓縮效率超越最新國際标準HEVC(H.265)。
可以推測,由于技術陳舊需要更新及收費較高等原因,MPEG-2即将退出曆史舞台。MPEG-4出台的新專利許可政策被認為過于苛刻令人無法接受,導緻被衆多營運商圍攻,陷入無法推廣産業化的泥沼而無力自拔,前途未蔔。而AVS是基于我國創新技術和部分公開技術的自主标準,第一代AVS編碼效率比MPEG-2高2-3倍,與AVC相當,技術方案簡潔,晶片實作複雜度低,達到了第二代标準的最高水準;而且,AVS通過簡潔的一站式許可政策,解決了AVC專利許可問題死結,是開放式制訂的國家、國際标準,易于推廣;第二代AVS2編碼效率比第一代标準提高了一倍以上,壓縮效率超越最新國際标準HEVC(H.265)。此外,AVC僅是一個視訊編碼标準,而AVS是一套包含系統、視訊、音頻、數字版權管理在内的完整标準體系,為數字音視訊産業提供更全面的解決方案。綜上所述,AVS可稱第二代信源标準的上選。
第一代AVS标準制訂起始于2002年,指系列國家标準《資訊技術 先進音視訊編碼》(簡稱AVS1,國家标準代号GB/T 20090)和廣電系列标準《廣播電視先進音視訊編解碼》(簡稱AVS+)。AVS1包括系統、視訊、音頻、數字版權管理等四個主要技術标準和符合性測試等支撐标準,目前共14個部分。GB/T 20090視訊标準于2006年2月頒布,目前GB/T 20090系列國家标準已頒布9項。針對廣電應用制訂的行業标準《廣播電視先進音視訊編解碼 第1部分:視訊》于2012年7月獲批為行業标準,行标号為GY/T 257.1----2012,簡稱AVS+。
第二代AVS标準包括系列國家标準《資訊技術 高效多媒體編碼》(簡稱AVS2),AVS2主要面向超高清電視節目的傳輸,定位在引領未來五到十年數字媒體産業的發展,并争取為相關國際标準的制定發揮關鍵作用。在第一代AVS推廣應用的同時,AVS技術的持續演進工作在積極推進,第二代标準AVS2技術已開發完成,2016年5月,廣電總局頒布AVS2視訊為行業标準,2016年12月30日,頒布為國家标準。
經國家新聞出版廣電總局、工業和資訊化部測試機構測試,第一代AVS的壓縮效率與同期國際标準MPEG-4 AVC/H.264相當,比原視訊編碼國家标準GB/T 17975.2-2000(等同采用ISO/IEC 13818.2-1994,即MPEG-2)提高一倍以上。因而能夠成倍節省頻譜和帶寬,經濟效益突出。根據國家新聞出版廣電總局廣播電視規劃院進行的嚴格測試,第二代AVS2編碼效率比第一代标準提高了一倍以上,壓縮效率超越最新國際标準HEVC(H.265),相對于第一代AVS标準,第二代AVS标準可節省一半的傳輸帶寬,将支撐未來幾年超高清電視在我國的推廣應用。
目前,AVS标準除在廣電領域廣泛使用,已進入網際網路領域,下一步AVS2會進入監控應用。
2016年初,AVS已啟動VR國際标準和國家标準的制定,AVS VR國際标準已完成立項。2017年1月開始,AVS工作組已啟動《資訊技術 虛拟現實内容高效編碼》(簡稱AVS VR标準)系列标準的國家立項申請工作。
2018年初,第二代AVS系統部分《資訊技術 高效多媒體編碼 第1部分:系統》和音頻部分《資訊技術 高效多媒體編碼 第3部分:音頻》進入國标委審批,等待頒布。
2018年6月7日,我國第二代數字音頻編碼标準《資訊技術 高效多媒體編碼 第3部分:音頻》(簡稱AVS2音頻标準)由國家市場監督管理總局和國家标準化管理委員會頒布為國家标準,标準代号GB/T 33475.3-2018,将于2019年1月1日正式實施。AVS2音頻标準立足提供完整的高清三維視聽技術方案,與第二代AVS視訊編碼(AVS2視訊)配套,是更适合超高清、3D等新一代視聽系統需要的高品質、高效率音頻編解碼标準。将應用于全景聲電影、超高清電視、網際網路寬帶音視訊業務、數字音視訊廣播無線寬帶多媒體通信、虛拟現實和增強現實及視訊監控等領域。
AVS産業化的主要産品形态包括:
(1). 晶片:高清晰度/标準清晰度AVS解碼晶片和編碼晶片。
(2). 軟體:AVS節目制作與管理系統,Linux和Window平台上基于AVS标準的流媒體播出、點播、回放軟體。
(3). 整機:AVS機頂盒、AVS硬碟播出伺服器、AVS編碼器、AVS高清晰度雷射視盤機、AVS高清晰度數字電視機頂盒和接收機、AVS手機、AVS便攜式數位産品等。
MPEG是ISO/IEC JTC1 1988年成立的運動圖像專家組(Moving Picture Expert Group)的簡稱,負責數字視訊、音頻和其它媒體的壓縮、解壓縮、處理和表示等國際技術标準的制定工作。
MPEG-1制定于1992年,它是将視訊資料壓縮成1~2Mb/s的标準資料流。它主要用于家用VCD,它需要的存儲空間比較大。
MPEG-2制定于1994年,是為進階工業标準的圖像品質以及更高的傳輸率而設計,它是高品質視訊音頻編碼标準。在正常電視的數字化、高清晰電視HDTV、視訊點播VOD,互動式電視等各個領域中都是核心的技術之一。
MPEG-4于1998年11月公布,主要應用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低。它與MPEG-2相比,可節省90%的儲存空間。MPEG-4标準是面向對象的壓縮方式,不是像MPEG-1和MPEG-2簡單地将圖像分為一些像塊,而是根據圖像内容,将其中的對象(物體、人物、背景)分離出來分别進行幀内、幀間編碼壓縮,并允許在不同的對象之間靈活配置設定碼率,對重要的對象配置設定較多的位元組,對次要的對象配置設定較少的位元組,進而大大提高了壓縮比,使其在較低的碼率下獲得較好的效果。
MPEG-7是針對存儲形式(線上、脫機)或流形式(如 Internet上的廣播、推送模型)的應用而制定的,并且可以在實時和非實時環境中操作。它是為網際網路視訊檢索制定的壓縮标準。MPEG-7标準的正式名稱為”多媒體内容描述接口”(Multimedia Content Description Interface), 其目标就是産生一種描述多媒體内容資料的标準,滿足實時、非實時以及推-拉應用的需求,它既不同于基于波形和基于壓縮的表示方式如MPEG-1和MPEG -2,又不同于基于對象的表示方式如MPEG-4,而是将對各種不同類型的多媒體資訊進行标準化描述,并将該描述與所描述的内容相聯系,以實作快速有效的搜尋。
MPEG-21 Multimedia Framework是緻力于在大範圍的網絡上實作透明的傳輸和對多媒體資源的充分利用。MPEG-21緻力于為多媒體傳輸和使用定義一個标準化的開放架構。
WMV(WINDOWS MEDIA VIDEO):是微軟推出的一種流媒體格式,WMV格式的體積非常小,适合在網上播放和傳輸。但由于非開放性标準,時延非常大。
H.261:于1990年完成,實際的編碼算法類似于MPEG算法,但不能與後者相容。用于電視會議、可視電話。
H.263:于1996年完成,與H.261相比采用了半象素的運動補償,并增加了4種有效的壓縮編碼模式。但是其限制了應用的圖像輸入格式,僅允許5種視訊源格式。
H.263+:允許更大範圍的圖像輸入格式,自定義圖像的尺寸,進而拓寬了标準使用的範圍,使之可以處理基于視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。
H.263++:在H263+基礎上增加了3個選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時為了提高增強編碼效率。
H.264/MPEG-4 AVC:壓縮能力比H.263更強。高壓縮比、高圖像品質、良好的網絡适應性,在較低帶寬上提供高品質的圖像傳輸。是為新一代互動視訊通訊制定的标準。該标準也被稱為AVC(Advanced Video Coding)标準,是MPEG-4的第10部分。
H.265:是繼H.264之後所制定的新的視訊編碼标準。H.265标準圍繞着現有的視訊編碼标準H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼品質、延時和算法複雜度之間的關系,達到最優化設定。H.265旨在在有限帶寬下傳輸更高品質的網絡視訊,僅需原先的一半帶寬即可播放相同品質的視訊。這也意味着,我們的智能手機、平闆機等移動裝置将能夠直接線上播放1080p的全高清視訊。H.265标準也同時支援4K(4096×2160)和8K(8192×4320)超高清視訊。
IPB幀:視訊中每幀代表一幅靜止的圖像,而在實際壓縮時,會采取各種算法減少資料的容量,其中IPB就是最常見的。
I幀是關鍵幀,屬于幀内壓縮(P、B為幀間)。盡可能去除圖像空間備援資訊來壓縮傳輸資料量的幀内編碼圖像。I幀法是基于離散餘弦變換DCT(Discrete Cosine Transform)的壓縮技術,這種算法與JPEG壓縮算法類似。采用I幀壓縮可達到1/6的壓縮比而無明顯的壓縮痕迹。解碼時僅用I幀的資料就可重構完整圖像。
P幀也叫預測幀,表示的是這一幀跟之前的一個關鍵幀(或P幀)的差别,解碼時需要用之前緩存的畫面疊加上本幀定義的差别,生成最終畫面。也就是差别幀,P幀沒有完整畫面資料,隻有與前一幀的畫面差别的資料。
B幀也叫雙向預測幀。既考慮與源圖像序列前面已編碼幀,也顧及源圖像序列後面已編碼幀之間的時間備援資訊來壓縮傳輸資料量的編碼圖像。B幀不是參考幀,不會造成解碼錯誤的擴散。
一般地,I幀壓縮效率最低,P幀較高,B幀最高。I、B、P各幀是根據壓縮算法的需要,是人為定義的,它們都是實實在在的實體幀,至于圖像中的哪一幀是I幀,是随機的,一旦确定确定了I幀,以後的各幀就嚴格按規定順序排列。
視訊檔案封裝(容器):封裝格式就是将已經編碼壓縮好的直播帶貨源碼視訊軌和音頻軌按照一定的格式放到一個檔案中,這個檔案也就相當于一個容器。采用不同的方式把直播帶貨源碼視訊編碼和音頻編碼打包成一個完整的多媒體檔案,也就出現了不同的字尾,常見的封裝格式:
(1). AVI:微軟在90年代初創立的封裝标準,其含義是Audio Video Interactive,就是把視訊和音頻編碼混合在一起儲存。
(2). mov:QuickTime Movie是由蘋果公司開發的容器。
(3). WMV:是微軟公司開發的一組數位視訊編解碼格式的通稱。
(4). mkv: Matroska的簡稱,萬能封裝器,有良好的相容和跨平台性、糾錯性,可帶外挂字幕。
(5). flv: 這種封裝方式可以很好的保護原始位址,一些視訊分享網站采用這種封裝方式。
(6). rmvb/rm:Real Video,由RealNetworks開發的應用于rmvb和rm的不同封裝方式。rm是固定碼率,rmvb是動态碼率(就是靜态畫面采用用低碼率,動态采用高碼率)。
(7). MP4:主要應用于mpeg4的封裝。
(8). 3GP:主要應用于H.263的封裝。
由于直播帶貨源碼的不同播放器支援不同的視訊檔案格式,或者計算機中缺少相應格式的解碼器,或者一些外部播放裝置(比如手機、MP4等)隻能播放固定的格式,是以就會出現視訊無法播放的現象。在這種情況下就要使用格式轉換器軟體來彌補這一缺陷。
注:以上全部内容均來自網絡,主要參考: