天天看點

AV1顯著超越H.265和VP9?—MSU最新比較公布

本文轉載自“煤礦工廠”。莫斯科國立大學(MSU)開啟了一項從主觀層面對比視訊品質的服務,本文是他們對AV1和VP9、HEVC編碼品質的測試結果。

前言

最新的編碼品質對比研究表明,視訊編碼标準AV1在品質已經登頂,但在編碼速度方面仍與VP9、HEVC相差甚遠。同時,莫斯科國立大學(MSU)開啟了一項從主觀層面對比視訊品質的服務,名為Subjectify.us。

MSU的研究表明,僅考慮編碼品質時,AV1的性能已勝過HEVC和VP9,成為目前品質最高的可用視訊編碼标準。同時發現,在正常操作模式下,VP9相比于HEVC也有更好的編碼品質。不過,以上僅是MSU 2017編碼對比報告中諸多亮點的一小部分,除此之外,MSU開展了線上對比視訊與靜态圖像主觀品質的服務,并對于SSIM在運用于度量編碼品質的測試時需作出的調整問題有了一些新的發現。

MSU從06年就已開始在編碼品質對比領域進行深入研究,并在15年公開了HEVC與其他标準比較的成果。近年來,MSU繼續利用多類視訊/圖像檔案,多種測試方法,多種解碼器不斷更新出編碼對比測試的版本。MSU今年将對比報告分為五個部分,每部分的大體内容如下所示:

圖1 MSU報告概述

AV1标準将逐漸盛行

這部分将針對上圖中的Part.5進行展開描述。其中,圖2為解碼器客觀品質對比中最具總結性的圖表。從圖中可看到,在編碼品質相同的情況下,AV1标準僅産生相比于x264 55%的資料量,其次是三通道和二通道Placebo模式下的x265标準,分别産生67%和69%的資料量,然而這兩種模式在編解碼中并不多見。

同時,報告中對于編碼速率也提出了明确的說明:“AV1的編碼速率低于其他編碼标準2500-3000倍不等,x265的Placebo模式與其他标準的差别有10-15倍”。但MSU發現,AV1還未被完全優化,這也意味着AV1距離實際的投入使用還需要一段時間。 

圖2 各類編碼标準品質對比

MSU在對比時對VP9采用了最慢以及次慢的編碼配置,這兩種配置常被用于實際的資料傳輸。VP9呈現出了略優于x265雙通道模式的性能,在對比,闡明系統參數的過程中,MSU也常向編碼解碼器的開發商咨詢确認,并會采用一些開發商實際使用的參數進行測試。最終得到一個嚴謹的結論:在利用31個高清視訊樣本和獨立的第三方配置條件下,VP9比HEVC有更好的品質表現。

Subjectify.us産生的主觀測試結果

今年MSU的報告中第一次包含主觀測試結果,系統效果如下圖所示。Subjectify.us允許使用者上傳不同類型的圖像或視訊,并處理使用者的主觀評價。在測試期間,使用者需要頻繁點選以保證他們測試的專注程度。

例如,一次測試會出現10個樣本,每個樣本會有原始樣本和壓縮樣本,顯然,原始樣本在主觀品質上總優于壓縮樣本。如果使用者在這類對比上産生了錯誤的判斷,則認為他們的測試結果無效,并終止他們的測試。

圖3 Subjectify.us系統界面

MSU通過Subjectify.us收集了325人次的11530次對比結果,MSU團隊折算後的主觀評分計算出平均比特率的評分。下圖則展示了主觀評分對于HEVC編碼器整體評分(包含速率)的影響。

圖4 HEVC編碼器整體得分

從目前的各類成果來看,主觀測試費時費力費财,因而Subjectify已是一種研究者或開發商選取編碼方式的良好途徑。

Tune SSIM

最後一項有意義的發現是關于編碼配置tune SSIM的。這是源于x264和x265開發者發現,單一的用于提高主觀品質的解碼工具會引起客觀名額如SSIM、PSNR數值的下降。是以開發者通常放棄這類名額中影響視覺品質的調整,使得兩者協調一緻。

以下是來自x265檔案的建議:“SSIM/PSNR調優的選項會禁止一切以犧牲視覺品質為代價的名額優化”。據此,x265中常以可到達的最高視覺品質為基準進行調優。

同樣,也可以以SSIM為基準進行調整,但這可能會使主觀評分急劇下降。然而,MSU的研究發現了相反的結果,特定調整後的x264/x265編碼性能反而比未調整前更好,結果如下所示。

圖5 SSIM調整前後品質對比

MSU的這一結果實際上是在1Mbps至4Mbps之間傳輸1080p視訊的條件下得到的,對此,x264的開發者是這樣回應的:

“1-4Mbps對于1080p視訊的解碼來說是較低的比特率,此時會産生鈴铛效應或者區塊效應,這本身就降低了主觀品質,因而以犧牲視覺品質為代價的客觀名額調整需在高比特率條件下進行。同時,SSIM的調整也分為兩種模式,一種模式因其自适應性并不需要太多的變形,而另一種則相反,因而不同類型的調整也會影響最終的結果。”

但實際上,4Mbps對于1080p視訊的傳輸來講已不算太低,這使得利用客觀名額對比編碼品質的研究變得迷茫,研究者究竟應該用什麼範圍的速率進行SSIM調整的測試研究?對此,x264開發者認為或許對每個源均進行變形的方法可以得到理想的效果,但這也會引發名額計算需簡化的問題。

由此,MSU的成果帶來了一個利用SSIM和PSNR比較傳輸速率跨度較大的視訊集時的有效性問題。對于這個問題,或許更先進的名額,如VMAF,可以避免這樣的沖突,又或許隻能通過主觀對比才能消除這種沖突。衆多相關領域人員也希望接下來的幾個月甚至更長的時間能有團隊解決這個難點。

參考自:

  • http://www.streamingmedia.com/Articles/News/Online-Video-News/AV1-Beats-VP9-and-HEVC-on-Quality-if-Youve-Got-Time-says-Moscow-State-122945.aspx
  • http://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Moscow-State-Releases-First-HEVC-Comparison-107455.aspx

繼續閱讀