天天看點

更智能化的CDN技術,CDN邁向3.0時代

我們的生活無時不刻不依賴着網絡,伴随着終日對網速慢的抱怨和詛咒,同時也享受着網絡技術發展帶來的紅利。懷着對技術細節刨根問底的執着,我們會發現原來身邊還存在着像CDN這樣生活在舞台背後的内容分發技術。然而當我們剛想了解他的時候,似乎他的步伐又邁得那麼矯健,正在完成CDN 2.0到3.0的跨越,貌似還是一場智能化的跨越。

更智能化的CDN技術,CDN邁向3.0時代

1.0到2.0,20年技術演進

CDN(Content Delivery Network),即内容分發網絡。其目的是通過在現有的Internet中增加一層新的網絡架構,将網站的内容釋出到最接近使用者的網絡“邊緣”,使使用者可以就近取得所需的内容,提高使用者通路網站的響應速度。CDN PoP(Point of Presence)架構是為内容傳送服務提供支援的軟體堆棧,到現在經曆了1.0到2.0的發展,直到智能化的3.0出現。下面我們将用少量的篇幅對這段曆史進行一下梳理。

CDN PoP 1.0的架構誕生于20年前,這對于當時的網站非常适合,一些小容量的資訊可以通過緩慢的網際網路連接配接實作傳遞。這時CDN的主要挑戰是從部署在網際網路服務提供商(ISP)的邊緣節點 (POPs)傳輸網頁内容。每一個接入POP的終端使用者都會快速獲得響應内容,而不是首先通過網絡(當時依然很慢)來通路源伺服器。通過這種方式,CDN可以很容易把受歡迎的内容發送給大量的網際網路使用者。

CDN PoP 2.0的架構離我們的生活更近了一些,也是我們目前使用最廣泛的CDN技術。由于2.0架構有基本的軟體堆棧組成,但不具備資料和資訊的深入分析,更不用談及少得可憐的智能化功能,這也就決定了其架構是被動的、響應式的、無狀态的。2.0架構的目标是緩存邊緣内容,并在邊緣進行一些簡單的處理,從就近原則中争取TCP傳輸性能上的提升。2.0架構以緩存軟體為核心,同時配套負載均衡、日志分析、DNS等服務。

CDN 3.0,向智能化不斷邁進

随着網絡服務的創新與移動終端的智能化,與此相适應的CDN也在不斷進化。似乎講到了這裡我們該請出今天的主角了——CDN 3.0,下面我們将從幾個方面的對比去闡述3.0究竟有哪些優勢。

關于CDN 3.0的研究其實經曆了大量的理論研究和論證,包括流處理器,批處理,消息代理, Hadoop,NoSQL,機器學習,Cassandra,Spark,深層神經網絡,循環神經網絡,卷積神經網絡以及大量的不同類型的算法等數百個概念。下面我們将從中抽取一些典型的研究内容來論證CDN 3.0的優勢:

規則引擎:許多CDN都具有自動規則引擎,用戶端可以為其内容設定緩存規則。機器學習模型中使用分類器可以使最先進的規則引擎難度回歸到史前科技水準。

WAF+DDoS+Bot緩解:這些用于應對威脅的分布式系統将會被監督式和非監督式機器學習模型取代,包括深層神經網絡、重複神經網絡等。

深度學習:我們不再需要手動進行緩存軟體棧、路由、存儲等繁瑣的配置,這些工作将會被學習模式所接管。

關于CDN 2.0和CDN 3.0的對比一言不和就上圖:

更智能化的CDN技術,CDN邁向3.0時代

圖一 CDN 2.0和CDN 3.0體系結構對比

但3.0架構卻截然不同,與生俱來的大資料和機器學習加持彰顯了其智能化的屬性。他将比2.0架構應對更龐大的邊緣傳輸,每個PoP節點都将成為Hadoop生态中的一環,包括HDFS、Apache Spark、Apache Flink、Kafka、Redis以及許多由Facebook、Google、LinkedIn、Spotify這類公司建立的開源插件等等。

在CDN 3.0架構世界裡,緩存工程師,網絡工程師等将與數學家和資料科學家一起工作。整個功能集将迎來無窮的變化,具體反映到所使用的算法類型以及算法數目。本來需要人工介入的任務,如叢集性能調優,網絡調優等,将采用機器學習(ML)等手段來解決。

機器學習将調優工作從手動調優改為自調優,即始終處于學習過程中。新的個性化功能特性将利用ML算法,先捕獲通路者通路站點的行為,然後将該行為用作分類器的輸入,最後基于教育訓練資料構模組化式。此後,每次通路者通路該網站時,ML算法都會對哪些頁面産生最多銷售量進行預測并個性化傳遞内容。

銷售機構他們将不得不接受全新的技術語言的再教育訓練,其中包括AI,機器學習,大資料,DevOps,資料科學,統計學和應用數學等。今天,機器學習這個詞或許隻是營銷部門使用的一個流行語。在适當的時候,CDN行業和機器學習的結合将會進一步深化,因為越來越多的人在微小的細節上受到教育啟發,例如什麼算法做什麼,每類算法的目的,各種神經網絡之間的差異等等。

我們也可以從了另一個次元去觀察這種變化

更智能化的CDN技術,CDN邁向3.0時代

圖2 CDN 2.0和CDN 3.0 Feature Set對比

面對網絡和軟體堆棧的大範圍更改,我們所做的或許不再是一味地增加代碼、通過API擴充功能或者是優化BGP路由,可能隻需要簡單地做下減法去換成更好用的3.0架構。CDN3.0的重要标志是其能很好地支援目前網際網路的主流應用,同時有更好的成本效益,服務品質更有保障,也更安全。事實上,CDN 3.0已經應用在Facebook、LinkedIn和Twitter的場景中。下面我們用一張表格來做一些對CDN2.0和3.0做一些分析。

更智能化的CDN技術,CDN邁向3.0時代

表1 CDN 2.0和CDN 3.0特性對比

人工智能,噱頭還是革命

更智能化的CDN技術,CDN邁向3.0時代

圖3 技術分裂曲線

上圖是一個科研機構從2000年開始對技術創新程度按照時間推移的曲線變化,一段時期新技術出現的數量越多,創新等級越高,并稱之為技術分裂曲線。可以看出2015年前,創新技術的萌生和進步是一個線性增長态勢,随着大資料和機器學習技術的誕生,創新性的增長展現出了瘋狂的态勢。圍繞着這兩項技術的新技術萌生也逐漸推動者科技的發展。按照這個曲線的走勢,在未來的12個月内,機器學習和大資料技術将對整個科技界産生颠覆。

今天,機器學習這個詞或許隻是營銷部門炒作的詞彙,但在未來的某一天,它必将改變CDN産業。

參考連結:

1、https://www.bizety.com/2017/02/20/cdn-edge-pop-architecture-2-0-end-life-hello-3-0-architecture/

2、https://www.bizety.com/2017/03/07/cdn-pop-architecture-3-0-end-cdn-commoditization-part-1/

3、https://www.bizety.com/2017/03/08/cdn-pop-architecture-3-0-end-cdn-commoditization-part-2/

原文釋出時間為:2017-03-27

本文作者:佚名

本文來自雲栖社群合作夥伴“51CTO”,了解相關資訊可以關注“51CTO” 

繼續閱讀