天天看點

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

10月30日,一年一度的MSU世界編碼器大賽全高清(FullHD)客觀性能賽道成績公布,官方正式報告顯示,繼去年阿裡自研S265取得兩項PSNR名額第一名,阿裡自研的VVC編碼器S266首次亮相,就一舉獲得離線(1fps)檔9項評測名額中的6項第一,2項第二,1項第三。另外,在包含56項評測名額的企業版完整測試報告中,S266更是獲得其中的40項第一,10項第二,6項第三,成為唯一一個離線(1fps)檔所有名額都進入前三的編碼器。

阿裡巴巴音視訊實驗室負責人、淘系産品技術&平台生态業務負責人湯興(平疇)表示,内容化正在驅動網際網路進入新周期,音視訊技術的重要性越來越高。此次阿裡S266在MSU取得出色成績,是淘系技術長期以來對音視訊領域的持續投入和不斷創新的階段性成果。随着以淘寶直播、逛逛為代表的内容化業務的發展,内容場和電商場的雙重複雜度不斷疊加,未來不僅是音視訊技術,淘系技術在多模态、3D XR、認知計算與知識圖譜等技術領域的疊代長期都會處在加速狀态。

6項名額第一

今年MSU世界編碼器大賽雲集了國内外14家參賽機關的22款編碼器,包括華為、騰訊、愛奇藝、Google、Intel、MulticoreWare、HHI等知名科技企業或研究機構,可謂高手雲集,競争十分激烈。

MSU本次釋出了全高清客觀性能賽道的測試報告:

https://www.compression.ru/video/codec_comparison/2021/main_report.html

該報告給出了各個參賽編碼器在多項品質評價名額下的壓縮性能,這些名額包括實際業務場景中廣泛采用的SSIM、PSNR、MS-SSIM、VMAF等客觀品質評價名額。

最終,經過激烈地角逐,阿裡巴巴繼去年S265取得兩個檔次PSNR名額第一名成績之後,今年自主研發的VVC編碼器S266一共獲得了離線(1fps)檔9項評測名額中的6項第一、2項第二和1項第三,即:

YUV (4:1:1)-VMAF NEG、YUV (6:1:1)-VMAF NEG、YUV (4:1:1)-PSNR (avg. log)、YUV (6:1:1)-PSNR (avg. log)、YUV (4:1:1)-PSNR (avg. MSE)、YUV (6:1:1)-PSNR (avg. MSE)

2項名額第二

YUV (4:1:1)-SSIM、YUV (6:1:1)-SSIM

1項名額第三

Y-VMAF

S266也是以成為唯一一個離線(1fps)檔所有名額都進入前三的編碼器。

先來看全高清客觀性能離線(1fps)檔賽道MSU官方成績:

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

▐  按YUV (4:1:1)-VMAF NEG和YUV (6:1:1)-VMAF NEG這兩個名額排名:

第一名:阿裡巴巴S266_v2

第二名:阿裡巴巴S266_v1

第三名:華為HW266、騰訊Tencent266

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

圖中顯示,在同等YUV (4:1:1)-PSNR (avg. log)畫質下,S266比基準編碼器x265節省了50.9%的檔案大小;在同等YUV (6:1:1)-PSNR (avg. log)畫質下,S266比基準編碼器x265節省了45.9%的檔案大小。

▐  按YUV (4:1:1)-PSNR (avg. MSE)名額排名:

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

圖中顯示,在同等YUV (4:1:1)-PSNR (avg. MSE)畫質下,S266比基準編碼器x265節省了44.4%的檔案大小。

▐  按YUV (6:1:1)-PSNR (avg. MSE)名額排名:

第一名:阿裡巴巴S266_v1

第二名:騰訊Tencent VAV1

第三名:騰訊Tencent266

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

圖中顯示,在同等YUV (6:1:1)-PSNR (avg. MSE)畫質下,S266比基準編碼器x265節省了41.3%的檔案大小。

MSU世界編碼器大賽

MSU世界編碼器大賽是指由莫斯科國立大學(Moscow State University)主辦的面向全球各大公司、學術機構、開源社群和個人的編碼器比賽,從2005年起每年舉辦一次,現已成為視訊編解碼領域影響力最大的頂級權威賽事,谷歌、Intel、Netflix等在視訊編解碼領域頗有技術積累的科技巨頭都曾多次參加該項賽事,參賽編碼器代表了行業發展的風向标。

MSU的圖形與媒體實驗室(Graphics & Media Lab)作為權威的第三方視訊編碼器評測機構,在編碼器評測方面頗有年頭,從H.264、H.265、VP9、AV1到最新的VVC,其評測報告已被全球廣泛認可,有較高公信力,對推動全球編解碼技術發展、促進編碼器性能提升方面有标杆示範作用。

本屆大賽共有22款編碼器參賽(包括參照編碼器在内),分别來自于14家機關或個人,涵蓋了H.264、VP9、H.265、AV1、AVS3、H.266等多種視訊編解碼标準,這些标準在業界具有廣泛的代表性。

MSU2021世界編碼器大賽成績公布,阿裡自研編碼器獲六項第一

為什麼需要多種次元的評價名額?

和商用編碼器在實際業務中進行品質評估時并不能隻依賴一種品質名額一樣,MSU世界編碼器大賽也采用多種客觀品質評價名額,其中,SSIM(含MS-SSIM)、PSNR、VMAF是在實際業務場景中被廣泛采用的全參考客觀品質評價名額,分别從結構相似性、均方誤差、多個時空度量組合模拟主觀品質這三個次元評價編碼器輸出的失真視訊相對于原始視訊的相似程度或保真程度。

PSNR名額使用最為普遍,曆史也更為悠久,是基于對應像素點間的誤差,即基于誤差敏感的圖像品質評價方法。PSNR在促進編解碼标準發展程序中起到了至關重要的作用,目前仍是視訊編解碼器标準化事實上的行業标準。但是由于PSNR并未直接考慮到人眼視覺特性,因而在有些情況上會出現評價結果與人的主觀感受不完全一緻的情況。

SSIM名額從亮度、對比度和結構三個方面來估計失真圖像的視覺品質,旨在比較原始視訊和失真視訊的結構資訊,研究感覺結構的損傷,而不是感覺誤差。但SSIM名額在評價噪聲圖像、模糊圖像時也有一定局限性。MS-SSIM是在SSIM基礎上的改進,衡量了多尺度的結構相似性。

VMAF作為近些年出現的評價名額,利用大量的主觀資料作為訓練集,通過機器學習的手段将不同評估次元的算法進行“融合”,旨在得到一個能準确反映主觀意志的畫質評價标準。VMAF經過了若幹年的疊代和優化之後,最新的版本可以更好的克服一些之前發現的問題,在更大的程度上能夠反映人眼主觀感受,是以近幾年在商用系統中逐漸開始得到更加廣泛的應用。但人眼視覺系統是一個複雜系統,VMAF名額依賴于符合主觀特性的融合算法,還要有大量有效的、符合實際評測環境的資料集,是一個需要長期投入,不斷疊代的優化過程。

在實際操作中,客觀評價的内容是實體參量,評價的手段是實體量測量度,是以客觀評價能夠做到嚴格準确,具有較高的科學性和客觀性。此外,編碼器的不同子產品和算法優化對各項品質評價名額的敏感程度和表現差異也不盡相同。是以,根據實際業務場景,在編碼器開發的不同階段,采用多種客觀評價方法相結合的形式,可以全面評估編碼器優化效果,充分兼顧壓縮視訊的綜合品質。

阿裡自研VVC編碼器,能在本屆MSU大賽中獲得包括PSNR、SSIM、MS-SSIM、VMAF等9項評測名額中的6項第一、2項第二、1項第三,成為唯一一個所有名額都進入前三的編碼器,充分展現了S266編碼器在各項名額下的均衡表現和綜合實力。

展望及未來商用之路

通過MSU的權威認證,展現了S266強大的壓縮效率,但要推動VVC标準的商用,路還很長。這是因為VVC作為HEVC的下一代編碼标準,引入了諸多新的編碼工具,這些工具一方面帶來了壓縮效率的提升,同時也對算力提出了更高要求。經測試,在一台内置Intel i7-8700k晶片的個人電腦上,用VVC參考模型VTM11.0壓縮一段1080p視訊,隻能達到0.005幀每秒,而常見視訊一般為30幀每秒,需要提速6000倍。

與此同時,壓縮的視訊要讓消費者能看到,還需要一個解壓的過程。經過近十年的普及,常見手機晶片已經能解碼HEVC标準的視訊,但VVC标準壓縮的視訊還不能支援。通過手機的CPU做軟解壓是一個方案,但解碼速度同樣緩慢。在一台華為P40手機上,用VVC參考模型VTM11.0解壓一段1080p視訊,隻能達到 9 fps。

為了攻克這些技術難題,阿裡巴巴淘系技術沿用在S265上的大量專利技術,對VVC标準工具集進行大量研究,合理選擇編碼工具的組合來拿到VVC高壓縮效率的紅利,并使用機器學習方法,快速進行塊劃分和編碼模式決策,對RDO過程精簡并引入跨幀并行和CTU并行,大幅提高多核CPU的執行速度,還使用彙編指令集加速向量計算、優化記憶體通路效率。經過大量優化,S266的編碼器慢速檔比VTM11.0提速大于200倍,在快速檔上能達到實時編碼。另一方面,為了盡可能提升編碼器的壓縮效率,S266引入了基于CU-tree的預分析流程,并将預分析與編碼過程緊密結合,使用基于塊的運動補償時域濾波技術減少預測誤差,并采用自适應GOP決策,場景切換檢測,螢幕内容檢測技術來提高場景适應性;在碼率控制上,S266使用幀,行,塊三級碼控,結合場景檢測和噪聲檢測,精準有效的配置設定每個bit到最恰當的地方。在解碼速度上,淘系技術經過大量優化,于2021年4月向業界公布了手機端的VVC實時解碼器,普通手機僅使用2核就可以解碼720p視訊,最新釋出的手機甚至可支援4k 30fps實時解碼。

阿裡巴巴音視訊實驗室負責人、淘系産品技術&平台生态業務負責人湯興(平疇)表示:“淘系技術長期以來對音視訊領域的持續投入和不斷創新,造就了今天S265、S266在MSU世界視訊編碼器大賽的好成績,以及在淘寶直播、逛逛、點淘中超高清視訊的表現。未來的8K、VR/MR、元宇宙等,也将随着視訊編解碼技術的創新而蓬勃發展。期望淘系編解碼團隊,從業務場景出發,以進益求精的态度,進一步追求效率高,速度快,延時低的編碼技術,加速S266編碼器的技術創新,加快VVC标準在内容化社群的商業落地。”

繼續閱讀