天天看點

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

亞太内容分發大會上,阿裡雲進階産品營運專家俞翔受邀出席,并分享了基于CDN網絡建構超低延時直播的場景實踐。以下為演講原文。

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

近幾年,直播帶貨已經逐漸走進大衆視野。在今年上半年受疫情原因影響,直播營銷市場被加速催熟,這倒逼着企業探索線上業務。傳統高度依賴線下場景的行業也紛紛通過直播進行自救。“直播+”成為了趨勢,不少商家利用直播平台與廣大消費者互動,創造了新的服務與經營模式。

在這個過程中,無論是旅遊、餐飲或者傳統消費業,各行各業都會把直播作為新的營銷手段觸達最後的消費者。然而,與原來的秀場直播不同,電商直播過程中會面臨更多挑戰,如何把直播互動的環節做好,将觀衆和主播或者背景的管理人員、營運人員串聯在一起,至關重要。

延遲讓直播互動效果大打折扣

從最初的秀場直播開始到今天為止,整個直播的鍊路基本上已經實作标準化。主播線上下無論使用PC還是移動手機,都是在本地通過用戶端實作采集編碼,并通過推流的形式到直播中心,再經過轉碼等媒體處理,通過雲廠商CDN網絡,再經過RTMP實時的方案或者用FLV、HLS的方案,最終傳遞到觀衆側。

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

這個流程是單向的過程,直接從主播到觀衆。過程中的互動比如評論,是在音視訊流以外的旁路實作的。

很多觀衆希望跟主播有進一步的互動,比如音視訊層面互動,延時就成了關鍵的制約因素。 

我們現在推流都是用到RTMP,拉流觀看有用到RTMP、HLS或FLV,這三種協定延時的效果都是不同的。效果最好的是RTMP協定,也往往會因為各種原因會産生3-5秒鐘的延遲。這種體驗對于直播帶貨來說可以是一種災難,當主播介紹一個商品或者介紹某一項專門特性的時候,觀衆想提出問題,等到他提出問題,主播看到的時候,往返10秒鐘了,這會嚴重打亂主播的思路與其他觀衆的體驗感,甚至會降低成交率。

延時到底發生在哪裡?

在标準化的直播過程中,我們來分析整個鍊路的延時因素,進而尋找優化方案。

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

從最初的鍊路來看,采集、上行推流、CDN分發、下行拉流、解碼渲染,都存在一定的延時,而且比例不同。真正跟延時相關的從CDN分發開始往後到拉流到播放這段,這部分内容是真正影響到觀衆體驗的部分。根據我們對整個環節的延時原因的分析,RTMP是基于TCP的協定包,抗卡頓是産生延時的主要原因。随着5G時代到來,視訊分辨率上升到4K、8K的時候,高帶寬要求可能會造成更大的延時。假設目前720P視訊直播過程當中延時3-5秒,4K、8K的話也許延時更大。

阿裡雲CDN團隊對底層基礎設施能力,包括對當下主流新協定進行分析,希望能夠通過新技術棧應用來實作變道超車的作用。 

阿裡雲對業界主流的WEBRTC、QUIC、SRT進行了多元度的技術預研及應用分析。

下圖是各個協定的說明:

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

阿裡雲最終選擇結合WEBRTC技術進行了低延時直播的探索實踐,希望能夠将使用者帶入到低延時的時代。

如何進入低延時直播時代?

如下圖所示,視訊直播的基礎設施是覆寫全球的CDN基礎設施與CDN智能排程系統。左邊部分是技術現狀,右側是我們希望達到的效果。從通訊協定再到上面流媒體層面做一些改進,從TCP協定直接遷移到UDP,UDP在卡頓方面有很大的提升,進一步確定實時互動體驗。阿裡雲CDN希望能夠把現在RTMP、FLV、HLS協定轉化為WEBRTC協定,進而更好地滿足主播和觀衆互動的需求。

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

 基于這樣的架構,阿裡雲已經推出了一個産品——低延時直播RTS(Real-time Streaming),它是在視訊直播的基礎上,提供具備CDN高成本效益,又能滿足大規模并發的低延時直播。

作為視訊雲基礎設施,阿裡雲能夠為企業提供一套完整的端到端直播解決方案,下圖就是整體架構:

那幾秒延時到底來自哪?阿裡雲超低延時直播産品揭秘

第一,     改進推流端及拉流端SDK,滿足雲端協定棧的更新優化。

第二,     複用雲端基礎設施能力。将視訊直播過程中所需的編解碼、錄制等功能延續複用。

第三,     與原有的普通直播結合。方案可以支援使用者很輕松地把低延時直播和基礎直播、互動直播、視訊AI能力有機結合起來。

在此架構基礎上,阿裡雲CDN針對直播互動場景,進行了一些優化:

第一,優化網絡架構。CDN是一種邊緣節點的形态,将阿裡雲的CDN網絡從之前支援RTMP協定更新成為WEBRTC,從傳統的流媒體協定變成了實時傳輸協定,實作CDN網絡部分的更新。

第二,提供一種推流兩種拉流組合方案。方案允許使用者開啟兩個模式:一是很友善把以前RTMP協定繼續相容下去。二是直接開通WEBRTC低延時能力,對于使用者來講不需要做很多工作,內建一個SDK就能享受這個能力。優勢是可以直接相容現有的推流方式,尤其是專業裝置。

第三,全鍊路低延時監控工具。能夠對實時的網絡鍊路進行監控,并提供針對性優化方案,這對直播體驗的保障十分關鍵。從整個效果來看,播放延時基本緩沖在1秒鐘左右,有很大的改進。

第四,開放的協定信令。為便于客戶自行開發拉流播放器,阿裡雲CDN也開放了下行節點支援WEBRTC協定将直播流從阿裡雲直播系統拉取,用戶端讓使用者自主可控,快速搭建自身業務形态。

阿裡雲低延時直播産品的特性及應用案例

總結起來,阿裡雲CDN基于現有網絡進行優化改良,對于整個低延時直播場景具有以下六個特性:

第一,低延時。具有毫秒級延時,抗弱網能力。經過測試驗證,相同卡頓率下延時降低80%;

第二,無縫遷移。延續直播RTMP推流,不改變原有架構,僅需端上更新SDK;

第三,簡單易用。功能豐富易接入,直播、點播、轉碼、截圖、錄制、安全稽核等多場景功能;

第四,大規模高并發。阿裡雲CDN具有遍布全球的2800+邊緣節點優勢,離主播和觀衆更近,可以支援百萬級推流,千萬級并發拉流播放;

第五,成熟穩定。經受電商業務大規模線上檢驗的真正能落地的産品,電信級QoS;

第六,開放标準。開放WebRTC信令協定對接,用戶端使用者自研自可控。

俞翔認為:雖然低延時直播可能會帶來少許成本增加,但是好鋼用在刀刃上。尤其是在特定的場景中,低延時直播的價值會被有效放大,比如電商直播、教育直播、體育或者拍賣直播。 

阿裡雲低延時直播産品已經圍繞電商和教育兩個直播場景有了較好的落地。

第一是淘寶直播,基于超低延時直播産品,淘寶直播端到端的延遲降低85%,卡頓率降低20%,更好的互動體驗也讓支付UV和GMV得到了相應的提升。第二個是在疫情期間的線上教育課堂,線上教育平台上存在一個場景,當100個學生線上觀看,而隻有3-4個學生提問互動,如果純用WEBRTC技術的話,首先資費比較高,其次技術架構比較複雜。在采用了阿裡雲低延時直播産品之後,就可以解決以上問題,實作少部分學生的流暢互動的同時,也把互動課堂線上上面向于成百上千的學生進行播放,對于整個線上教育機構成本節約,給教育課型轉型帶來了很大的幫助。

CDN