在剛剛圓滿落幕的LiveVideoStackCon峰會上,阿裡雲進階技術專家周源進行了《視訊加密和DRM的實施實踐》主題分享。周源,有十多年音視訊研發經驗,之前在淘寶視訊負責開放平台,目前在阿裡雲視訊雲部門負責媒體處理,在大規模系統建設和雲計算方面都有非常豐富的實戰經驗。本文為演講原文,希望對視訊内容安全從業者有一些啟發。
在視訊加密這塊,其實是一個攻防戰,攻防的手段非常多,還會不斷的翻新,有很多技術手段,技術的發展也是日新月異。視訊保護技術其實已經更新了好幾代,我會給大家介紹下每一代技術是怎麼做的、背後的原理、遇到的問題以及業界的解法。會從資料加密、全鍊路保護、數字版權管理、内容識别四個方面來介紹。
資料加密原理——算法的選擇
最初,資料加密原理非常簡單,我們在生活中如果有一樣東西你想保護它,你會怎麼辦,你的第一反應可能就是拿把鎖把他鎖起來,自己保護好鑰匙。在數字領域,這個“鎖”有好多種,一種叫對稱型的,一種叫非對稱型的。
這兩種算法分别有各自的優缺點,對稱型算法的優點是計算量非常小,速度快,效率高。而它的缺點是密鑰的管理和分發非常困難,如果别人配了相同的一把鑰匙,就可以打開這把鎖了,不夠安全。常見的算法包括AES、EDS。非對稱型算法的優缺點其實和對稱型是相對的,優點是算法是公開的,你可以看到所有細節,即使這樣,安全性也非常高。非對稱算法有兩種類型的鑰匙:公鑰和私鑰。公鑰可以開放給所有人,内容隻能通過私鑰加密,加密完成後,使用公鑰就可以解密,但是不能進行加密。但是缺點是加密和解密花費的時間長,速度慢,是以不适合對大量資料加密,隻适合少量資料的加密。常見的算法包括RSA、ECC。
在視訊場景下,怎麼去權衡對稱加密和非對稱加密?
媒體媒體經曆了幾次更新,最早是文本,幾十KB就是非常大的一個小說了;到了圖檔就發展到了幾百KB,甚至MB的級别;如今視訊時代,量級上到GB級别。是以視訊的第一個特點是資料量大,加密算法速度不行的話是不夠實用化的。
視訊的應用越來越廣泛,它不僅僅局限于某一個平台。使用者會在各種作業系統、各種終端裝置上去觀看視訊,在選擇算法的同時,一定要考慮平台标準化這塊。
更進一步的話,需要考慮移動端的功耗問題,大家做視訊都在能耗和發熱做鬥争,選擇算法的時候,一定要考慮功耗問題。

最終的選擇——AES算法
基于以上考慮,業界大家最終會選擇AES算法。它具有以下特點:
- 安全性,AES算法從數學上證明是安全的。把加密好的檔案給到你,你沒拿到鑰匙的情況下,暴力破解需要花2104億年的時間,這幾乎是一個不可能完成的任務。現在也存在一種旁路攻擊的方法,攻擊的是實作方法,不是算法本身。攻擊成本比較高,在增加成本的前提下,實作上是有規避的方法。是以安全性還是有保障的。
- 這個算法衡量了時-空占比,速度快、消耗小,适合小型系統上工作。
- 算法也非常标準化,也在絕大部分的硬體晶片、軟體平台中進行内置,可以用硬體本身的能力快速做計算。
一般情況下密鑰越長,安全性越高。但是密鑰短并不代表運算速度一定會快。同時,因為均衡了時-空占比,AES算法的資源消耗也是最低的。是以,AES算法在對稱算法中是首選。
AES算法的經典應用——HLS資料加密
舉個例子,HLS協定使用M3U8檔案格式。關鍵性的資訊是下圖中橙色的一行,這裡加了KEY的資訊。它的原理是播放器從網上把m3u8下載下傳下來,解析後得到KEY,并且傳遞給伺服器詢問請求通過不通過,伺服器如果認證通過,會把真實的KEY傳回給播放器進行播放。
僅僅使用AES加密來包含内容時,它的安全問題出在哪裡呢?
它的最關鍵的問題是——鑰匙URL。因為URL要被寫在檔案裡的,不管你做什麼變化,無論加session、referer、token,它都是标準的HTTP請求,這是HLS加密的最大風險點。
因為網絡請求是公開的,我們怎麼保障網絡傳輸安全性?防禦中間人攻擊?
而在用戶端拿到鑰匙後,實際上是明文内容,用戶端的安全性又該如何保障?
如此我們便有了新解法——全鍊路保護
這裡有兩個很重要的原則,第一個是中間網絡是不可信的,第二個是用戶端是不可信的。接下來看看這兩個問題如何解決。
關于中間網絡不可信,HTTPS是最經典的方案。因為HTTPS整個流程保證了沒有任何人能竊取中間的資訊,安全的從服務端傳遞到用戶端。
它整個流程是:黑色的部分是公開的,誰看到都不會影響安全性。用戶端向服務端請求一次,服務端會傳回公鑰,用戶端用公鑰去把自己的對稱鑰匙保護一次。接着把加密後的對稱鑰匙傳遞給服務端,服務端使用秘鑰解碼後得到對稱鑰匙。這時候用戶端和服務端雙方都知道對稱鑰匙了,然後用對稱鑰匙對資料加密進行傳遞。這個方案即解決了安全性問題,又解決了效率問題。
關于用戶端不可信。通常用戶端是非常複雜的,常見的是浏覽器,标準也很多(如下圖)。但是在整個規劃中,很重要的一點是:“有定義,但沒有實作”。每個浏覽器都支援H5的DRM方案,但是每個浏覽器的支援方式都是不一樣的。
H5整個流程是,當解碼器拿到加密資料之後,資料流會經過CDM,這個子產品會和外部系統進行通訊,去和License服務擷取内容鑰匙和授權規則,經過了這一步才能真正把流解密成明文資料去做渲染。是以,雖然有了H5的規範,但是實際上還是會被廠商綁定,用戶端安全性完全由廠商提供的CDM來決定。
移動端方面,分為Web端和APP。Web端浏覽器是非常複雜的,各種定制的WebKit引擎不支援内容解碼子產品(Content Decryption Module),隻能采用JavaScript去寫代碼,它是明文代碼,安全性很差。現在有一個新的技術WebAssembly,它是把JS編譯一下,增加了破解的難度,但是還是沒有從源頭解決這個問題。APP是沒有任何标準了,都靠自己去定制。
如此看來,我們想解決用戶端不可信這件事,其實還有很多障礙在裡面。同時,用戶端不可信帶來了很多問題,你沒法知道你用戶端裡是好人還是壞人,如果是惡意使用者,他的破壞力普通比較強,會給平台帶來很大的損失。
全鍊路的保護解決了網絡傳輸的安全,但是用戶端的安全問題沒有得到徹底完全的解決,是以在業界有了第三種解法:數字版權保護(DRM)。
更安全的加密方式——數字版權保護DRM
DRM基本是三足鼎立的情況,微軟的PlayReady,谷歌的Widevine,蘋果的FairPlay。不同作業系統、浏覽器和移動平台需要不同的方案,是以看起來我們沒辦法用一套方案把所有的加密都做完。
是以如何跨平台把問題解決掉?——多重DRM解決方案
我們分别來看看三個廠商的方案:PlayReady方案中,當你的裝置和服務得到一個認證後,才能接着發起License請求,分了兩個階段來送出。Widevine方案中,通過第一段來控制是否有權限複雜的鑰匙,再從License去拿真正的鑰匙。FairPlay方案中,播放器第一個流程是認證,第二個流程是擷取License。
如此,我們有了多重DRM解決方案,它的流程是Player去問認證服務允不允許通路視訊,背景經過認證後,會給一個認證後的token。當認證允許通路的時候,通過CDN分發網絡從源站擷取内容,當拿到内容後,有了token和視訊KEY ID,就會把License傳回,這裡才有真正能解密内容的鑰匙。
多重DRM可以降低加密成本,對于不同平台,把整個流程做一緻化,隻需要一份加密資産,降低了加密流程成本和管理成本。同時,因為原生 DRM 用戶端在其原生平台上通常是免費提供的,也可以消除用戶端的許可成本。
從技術角度上,整個業界有通用加密格式的規範,可以很好的把加密内容安全地傳輸到用戶端。但是有一個現實情況,FairPlay的加密算法是不同的,為了實作多重DRM方案,我們需要兩份加密資産,才能真正做到跨平台的保護。
那麼DRM是否是最終的加密方案呢?從安全性上來講,DRM用了非對稱算法,但是依然會面臨主密鑰洩露這個問題,網上也出現HDCP主秘鑰洩露、4K視訊版權保護技術被破解等案例。
我們用鑰匙去保護視訊、在全鍊路保護上做了很多改進,并且采用了更安全的多重DRM方案,我們試圖用各種方法把内容保護起來,這些思路都叫被動保護。被動包含的每種方法都有自己的缺陷,是以我們給出一種新的思路,叫内容識别。
主動保護——内容識别
目前,版權保護遇到的問題是“内容所有權”跟“版權”的關系越來越複雜,這使我想起凱文.凱利在《必然》中曾提出:“對已有事物的重新排列和再利用,而對傳統的财産觀念和所有權概念産生巨大的影響。”
這裡面就延伸出來很多問題,使用者是否對原有素材做了一定的轉化,還是僅僅複制了原作?我們應該是嚴格禁止還是開放包容的态度?在這個全民導演的時代,我們可以看到很多使用者把自己錄制或者網上收集的素材重混起來,就成為了很成功的新作品。當然,版權方也有真實的案例,即使得内容得到了很好的二次傳播,還驚喜地獲得額外的收益。面對這樣的情況,我們該如何進行高效地内容識别和保護?
視訊指紋——給視訊賦予唯一身份
阿裡雲視訊雲團隊自研了視訊指紋技術,它是一種識别、提取、壓縮視訊的技術,可以産生唯一的“指紋”來代表視訊檔案進行視訊查找。你可以通過算法得到指紋資訊,用這個指紋資訊和版權庫中的視訊進行檢索比對,就可以很迅速地找到相似的視訊源。它不僅判斷唯一性,還可以找到究竟使用了視訊源的哪一段。
視訊指紋技術可以解決如下的場景的問題:
1. 版權保護
新增視訊與版權庫做比對,對存在版權風險的視訊進行播放控制,降低侵權風險;對自有版權的視訊資源,從公網抓取視訊資料鑒别,防止自有版權内容被侵權。
2. 原創識别
能識别這段視訊是從哪個片子剪輯出來的,識别視訊是否是原創視訊、剪輯後視訊、自媒體再創造視訊。
3. 廣告分成
傳播不要緊,當能做到視訊回溯的時候,就可以判斷新上傳的視訊原創性,檢索分成庫召回認領視訊,找到真正的視訊版權主,進而支撐廣告分成業務生态。
回顧
整體視訊保護技術曆經了幾次更新,最後,我們進行一個回顧和總結。
資料加密
它是有安全基礎,有算法保障的,但是沒有解決問題
全鍊路保護
整體的保護方案,但是無法落地,沒辦法大規模使用
數字版權管理(DRM)
更完善、更安全的保護方案,但是依舊存在風險
内容識别
改變思路,變被動為主動,開拓更廣闊的空間
歡迎釘釘掃碼,加入視訊雲産品咨詢群: