阿裡雲周源：一篇文章讀懂四代視訊加密技術演進

在剛剛圓滿落幕的LiveVideoStackCon峰會上，阿裡雲進階技術專家周源進行了《視訊加密和DRM的實施實踐》主題分享。周源，有十多年音視訊研發經驗，之前在淘寶視訊負責開放平台，目前在阿裡雲視訊雲部門負責媒體處理，在大規模系統建設和雲計算方面都有非常豐富的實戰經驗。本文為演講原文，希望對視訊内容安全從業者有一些啟發。

在視訊加密這塊，其實是一個攻防戰，攻防的手段非常多，還會不斷的翻新，有很多技術手段，技術的發展也是日新月異。視訊保護技術其實已經更新了好幾代，我會給大家介紹下每一代技術是怎麼做的、背後的原理、遇到的問題以及業界的解法。會從資料加密、全鍊路保護、數字版權管理、内容識别四個方面來介紹。

資料加密原理——算法的選擇

最初，資料加密原理非常簡單，我們在生活中如果有一樣東西你想保護它，你會怎麼辦，你的第一反應可能就是拿把鎖把他鎖起來，自己保護好鑰匙。在數字領域，這個“鎖”有好多種，一種叫對稱型的，一種叫非對稱型的。

這兩種算法分别有各自的優缺點，對稱型算法的優點是計算量非常小，速度快，效率高。而它的缺點是密鑰的管理和分發非常困難，如果别人配了相同的一把鑰匙，就可以打開這把鎖了，不夠安全。常見的算法包括AES、EDS。非對稱型算法的優缺點其實和對稱型是相對的，優點是算法是公開的，你可以看到所有細節，即使這樣，安全性也非常高。非對稱算法有兩種類型的鑰匙：公鑰和私鑰。公鑰可以開放給所有人，内容隻能通過私鑰加密，加密完成後，使用公鑰就可以解密，但是不能進行加密。但是缺點是加密和解密花費的時間長，速度慢，是以不适合對大量資料加密，隻适合少量資料的加密。常見的算法包括RSA、ECC。

在視訊場景下，怎麼去權衡對稱加密和非對稱加密？

媒體媒體經曆了幾次更新，最早是文本，幾十KB就是非常大的一個小說了；到了圖檔就發展到了幾百KB，甚至MB的級别；如今視訊時代，量級上到GB級别。是以視訊的第一個特點是資料量大，加密算法速度不行的話是不夠實用化的。

視訊的應用越來越廣泛，它不僅僅局限于某一個平台。使用者會在各種作業系統、各種終端裝置上去觀看視訊，在選擇算法的同時，一定要考慮平台标準化這塊。

更進一步的話，需要考慮移動端的功耗問題，大家做視訊都在能耗和發熱做鬥争，選擇算法的時候，一定要考慮功耗問題。

最終的選擇——AES算法

基于以上考慮，業界大家最終會選擇AES算法。它具有以下特點：

安全性，AES算法從數學上證明是安全的。把加密好的檔案給到你，你沒拿到鑰匙的情況下，暴力破解需要花2104億年的時間，這幾乎是一個不可能完成的任務。現在也存在一種旁路攻擊的方法，攻擊的是實作方法，不是算法本身。攻擊成本比較高，在增加成本的前提下，實作上是有規避的方法。是以安全性還是有保障的。
這個算法衡量了時-空占比，速度快、消耗小，适合小型系統上工作。
算法也非常标準化，也在絕大部分的硬體晶片、軟體平台中進行内置，可以用硬體本身的能力快速做計算。

一般情況下密鑰越長，安全性越高。但是密鑰短并不代表運算速度一定會快。同時，因為均衡了時-空占比，AES算法的資源消耗也是最低的。是以，AES算法在對稱算法中是首選。

AES算法的經典應用——HLS資料加密

舉個例子，HLS協定使用M3U8檔案格式。關鍵性的資訊是下圖中橙色的一行，這裡加了KEY的資訊。它的原理是播放器從網上把m3u8下載下傳下來，解析後得到KEY，并且傳遞給伺服器詢問請求通過不通過，伺服器如果認證通過，會把真實的KEY傳回給播放器進行播放。

僅僅使用AES加密來包含内容時，它的安全問題出在哪裡呢？

它的最關鍵的問題是——鑰匙URL。因為URL要被寫在檔案裡的，不管你做什麼變化，無論加session、referer、token，它都是标準的HTTP請求，這是HLS加密的最大風險點。

因為網絡請求是公開的，我們怎麼保障網絡傳輸安全性？防禦中間人攻擊？

而在用戶端拿到鑰匙後，實際上是明文内容，用戶端的安全性又該如何保障？

如此我們便有了新解法——全鍊路保護

這裡有兩個很重要的原則，第一個是中間網絡是不可信的，第二個是用戶端是不可信的。接下來看看這兩個問題如何解決。

關于中間網絡不可信，HTTPS是最經典的方案。因為HTTPS整個流程保證了沒有任何人能竊取中間的資訊，安全的從服務端傳遞到用戶端。

它整個流程是：黑色的部分是公開的，誰看到都不會影響安全性。用戶端向服務端請求一次，服務端會傳回公鑰，用戶端用公鑰去把自己的對稱鑰匙保護一次。接着把加密後的對稱鑰匙傳遞給服務端，服務端使用秘鑰解碼後得到對稱鑰匙。這時候用戶端和服務端雙方都知道對稱鑰匙了，然後用對稱鑰匙對資料加密進行傳遞。這個方案即解決了安全性問題，又解決了效率問題。

關于用戶端不可信。通常用戶端是非常複雜的，常見的是浏覽器，标準也很多（如下圖）。但是在整個規劃中，很重要的一點是：“有定義，但沒有實作”。每個浏覽器都支援H5的DRM方案，但是每個浏覽器的支援方式都是不一樣的。

H5整個流程是，當解碼器拿到加密資料之後，資料流會經過CDM，這個子產品會和外部系統進行通訊，去和License服務擷取内容鑰匙和授權規則，經過了這一步才能真正把流解密成明文資料去做渲染。是以，雖然有了H5的規範，但是實際上還是會被廠商綁定，用戶端安全性完全由廠商提供的CDM來決定。

移動端方面，分為Web端和APP。Web端浏覽器是非常複雜的，各種定制的WebKit引擎不支援内容解碼子產品（Content Decryption Module），隻能采用JavaScript去寫代碼，它是明文代碼，安全性很差。現在有一個新的技術WebAssembly，它是把JS編譯一下，增加了破解的難度，但是還是沒有從源頭解決這個問題。APP是沒有任何标準了，都靠自己去定制。

如此看來，我們想解決用戶端不可信這件事，其實還有很多障礙在裡面。同時，用戶端不可信帶來了很多問題，你沒法知道你用戶端裡是好人還是壞人，如果是惡意使用者，他的破壞力普通比較強，會給平台帶來很大的損失。

全鍊路的保護解決了網絡傳輸的安全，但是用戶端的安全問題沒有得到徹底完全的解決，是以在業界有了第三種解法：數字版權保護（DRM）。

更安全的加密方式——數字版權保護DRM

DRM基本是三足鼎立的情況，微軟的PlayReady，谷歌的Widevine，蘋果的FairPlay。不同作業系統、浏覽器和移動平台需要不同的方案，是以看起來我們沒辦法用一套方案把所有的加密都做完。

是以如何跨平台把問題解決掉？——多重DRM解決方案

我們分别來看看三個廠商的方案：PlayReady方案中，當你的裝置和服務得到一個認證後，才能接着發起License請求，分了兩個階段來送出。Widevine方案中，通過第一段來控制是否有權限複雜的鑰匙，再從License去拿真正的鑰匙。FairPlay方案中，播放器第一個流程是認證，第二個流程是擷取License。

如此，我們有了多重DRM解決方案，它的流程是Player去問認證服務允不允許通路視訊，背景經過認證後，會給一個認證後的token。當認證允許通路的時候，通過CDN分發網絡從源站擷取内容，當拿到内容後，有了token和視訊KEY ID，就會把License傳回，這裡才有真正能解密内容的鑰匙。

多重DRM可以降低加密成本，對于不同平台，把整個流程做一緻化，隻需要一份加密資産，降低了加密流程成本和管理成本。同時，因為原生 DRM 用戶端在其原生平台上通常是免費提供的，也可以消除用戶端的許可成本。

從技術角度上，整個業界有通用加密格式的規範，可以很好的把加密内容安全地傳輸到用戶端。但是有一個現實情況，FairPlay的加密算法是不同的，為了實作多重DRM方案，我們需要兩份加密資産，才能真正做到跨平台的保護。

那麼DRM是否是最終的加密方案呢？從安全性上來講，DRM用了非對稱算法，但是依然會面臨主密鑰洩露這個問題，網上也出現HDCP主秘鑰洩露、4K視訊版權保護技術被破解等案例。

我們用鑰匙去保護視訊、在全鍊路保護上做了很多改進，并且采用了更安全的多重DRM方案，我們試圖用各種方法把内容保護起來，這些思路都叫被動保護。被動包含的每種方法都有自己的缺陷，是以我們給出一種新的思路，叫内容識别。

主動保護——内容識别

目前，版權保護遇到的問題是“内容所有權”跟“版權”的關系越來越複雜，這使我想起凱文.凱利在《必然》中曾提出：“對已有事物的重新排列和再利用，而對傳統的财産觀念和所有權概念産生巨大的影響。”

這裡面就延伸出來很多問題，使用者是否對原有素材做了一定的轉化，還是僅僅複制了原作？我們應該是嚴格禁止還是開放包容的态度？在這個全民導演的時代，我們可以看到很多使用者把自己錄制或者網上收集的素材重混起來，就成為了很成功的新作品。當然，版權方也有真實的案例，即使得内容得到了很好的二次傳播，還驚喜地獲得額外的收益。面對這樣的情況，我們該如何進行高效地内容識别和保護？

視訊指紋——給視訊賦予唯一身份

阿裡雲視訊雲團隊自研了視訊指紋技術，它是一種識别、提取、壓縮視訊的技術，可以産生唯一的“指紋”來代表視訊檔案進行視訊查找。你可以通過算法得到指紋資訊，用這個指紋資訊和版權庫中的視訊進行檢索比對，就可以很迅速地找到相似的視訊源。它不僅判斷唯一性，還可以找到究竟使用了視訊源的哪一段。

視訊指紋技術可以解決如下的場景的問題：

1. 版權保護

新增視訊與版權庫做比對，對存在版權風險的視訊進行播放控制，降低侵權風險;對自有版權的視訊資源，從公網抓取視訊資料鑒别，防止自有版權内容被侵權。

2. 原創識别

能識别這段視訊是從哪個片子剪輯出來的，識别視訊是否是原創視訊、剪輯後視訊、自媒體再創造視訊。

3. 廣告分成

傳播不要緊，當能做到視訊回溯的時候，就可以判斷新上傳的視訊原創性，檢索分成庫召回認領視訊，找到真正的視訊版權主，進而支撐廣告分成業務生态。

回顧

整體視訊保護技術曆經了幾次更新，最後，我們進行一個回顧和總結。

資料加密

它是有安全基礎，有算法保障的，但是沒有解決問題

全鍊路保護

整體的保護方案，但是無法落地，沒辦法大規模使用

數字版權管理（DRM）

更完善、更安全的保護方案，但是依舊存在風險

内容識别

改變思路，變被動為主動，開拓更廣闊的空間

歡迎釘釘掃碼，加入視訊雲産品咨詢群：

阿裡雲周源：一篇文章讀懂四代視訊加密技術演進

資料加密原理——算法的選擇

在視訊場景下，怎麼去權衡對稱加密和非對稱加密？

最終的選擇——AES算法

AES算法的經典應用——HLS資料加密

僅僅使用AES加密來包含内容時，它的安全問題出在哪裡呢？

如此我們便有了新解法——全鍊路保護

更安全的加密方式——數字版權保護DRM

是以如何跨平台把問題解決掉？——多重DRM解決方案

主動保護——内容識别

視訊指紋——給視訊賦予唯一身份

視訊指紋技術可以解決如下的場景的問題：

1. 版權保護

2. 原創識别

3. 廣告分成

回顧

資料加密

全鍊路保護

數字版權管理（DRM）

内容識别

阿裡雲開年Hi購季，視訊直播、視訊點播、CDN全線折扣，錯過這次，再等一年！點選了解活動詳情

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

HBuilder開發App Step1——環境搭建，HelloMUI 以及真機調試

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

C++ 第十五周報告1--《冒泡法排序》

[轉]iOS微信小視訊優化心得

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

android 主線程的相關問題

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希

阿裡雲周源：一篇文章讀懂四代視訊加密技術演進

資料加密原理——算法的選擇

在視訊場景下，怎麼去權衡對稱加密和非對稱加密？

最終的選擇——AES算法

AES算法的經典應用——HLS資料加密

僅僅使用AES加密來包含内容時，它的安全問題出在哪裡呢？

如此我們便有了新解法——全鍊路保護

更安全的加密方式——數字版權保護DRM

是以如何跨平台把問題解決掉？——多重DRM解決方案

主動保護——内容識别

視訊指紋——給視訊賦予唯一身份

視訊指紋技術可以解決如下的場景的問題：

1. 版權保護

2. 原創識别

3. 廣告分成

回顧

資料加密

全鍊路保護

數字版權管理（DRM）

内容識别

阿裡雲開年Hi購季，視訊直播、視訊點播、CDN全線折扣，錯過這次，再等一年！ 點選了解活動詳情

繼續閱讀

阿裡雲開年Hi購季，視訊直播、視訊點播、CDN全線折扣，錯過這次，再等一年！點選了解活動詳情