天天看點

搭好資料架構,這7個技術是關鍵

數字化轉型的核心是資料,它已成為商業中最有價值的事務。由于格式不相容,傳統資料庫的局限性,以及無法靈活地合并來自多個來源的資料,組織長期以來一直受到其使用資料的困擾。新興技術的出現有望改變這一切。

企業IT基礎設施平台的重新建構是一項複雜的任務。重新建構平台通常由一系列變化的關鍵業務驅動因素引發,現在情況正是如此。簡而言之,主導企業IT技術的近30年的平台無法再滿足推動業務發展所需的工作負載的需求。

改善軟體部署模式是消除資料使用障礙的一個主要方面。更高的“資料靈活性”還需要更靈活的資料庫和更具可擴充性的實時流式傳輸平台。實際上,事實上,至少有七種基礎技術可以結合在一起,為企業提供一種靈活的、實時的“資料結構”。

與他們正在取代的技術不同,這七種軟體創新能夠擴充以滿足許多使用者和許多用例的需求。對于企業而言,他們有能力實作更快、更明智的決策,并創造更好的客戶體驗。

  1. NoSQL資料庫

RDBMS在資料庫市場上占據了近30年的主導地位。但是,面對資料量的不斷增長以及資料處理速度的加快,傳統關系資料庫已經顯示出其不足。NoSQL資料庫由于其速度和擴充能力而被接管。就文檔資料庫而言,它們從軟體工程的角度提供了一個更簡單的模型。這種更簡單的開發模式可加快産品上市速度,并幫助企業更快響應客戶和内部使用者的需求。

2.實時流媒體平台

實時響應客戶對客戶體驗至關重要。在過去的10年中面向消費者的行業經曆了巨大的颠覆,這并不神秘。這與企業對使用者實時做出反應的能力有關。轉向實時模型需要事件流。

消息驅動的應用程式已存在多年。然而,如今的流媒體平台的規模比以往要大得多,成本要低得多。最近流媒體技術的進步為許多優化業務的新方式打開了大門。通過為軟體開發和測試團隊提供實時回報循環,事件流還可以幫助企業提高産品品質,并更快地開發新的軟體。

  1. Docker和容器

容器對開發人員和操作人員,以及組織本身都有很大的好處。傳統的基礎設施隔離方法是靜态分區,即為每個工作負載配置設定一個單獨的固定資源塊(無論是實體伺服器還是虛拟機)。靜态分區可以更容易排除故障,但是實質性未充分利用的硬體成本很高。例如,Web伺服器平均隻使用了可用總計算量的10%。

容器技術的巨大好處是它能夠創造一種新的隔離方式。那些最了解容器的人員可能會相信他們可以通過使用Ansible、Puppet或Chef等工具來獲得同樣的好處,但實際上這些技術具有很強的互補性。此外,無論企業如何努力,這些自動化工具都無法實作在不同基礎設施和硬體設定之間自由移動工作負載所需的隔離。同一個容器可以在本地資料中心的裸機硬體上或公共雲中的虛拟機上運作,無需進行任何更改。這是真正的工作負載移動性。

4.容器存儲庫

容器存儲庫對于靈活性至關重要。如果沒有用于建構容器映像的DevOps程序以及用于存儲它們的資源回收筒,每個容器都必須建立在每一台機器中,才可以運作。通過存儲庫,可以在讀取該存儲庫的計算機上啟動容器映像。在多個資料中心處理時,這變得更加複雜。如果在一個資料中心内建立一個容器圖像,那麼如何将圖像移動到另一個資料中心?理想情況下,通過利用融合資料平台,企業将有能力在資料中心之間對存儲庫實作鏡像。

這裡的一個關鍵細節是,内部部署和雲計算之間的鏡像功能可能與企業的資料中心之間的鏡像功能差異很大。融合資料平台将通過提供這些功能為企業解決這個問題,而不管組織中使用的是資料中心基礎設施還是雲計算基礎設施。

5.容器編排

每個容器看起來都有它自己的私有作業系統,而不是靜态硬體分區。與虛拟機不同,容器不需要計算和記憶體的靜态分區。這使管理者能夠在伺服器上啟動大量容器,而無需擔心大量的記憶體量。有了像Kubernetes這樣的容器編排工具,啟動容器,移動它們并在環境中的其他地方重新啟動容器變得非常容易。

在新的基礎設施元件到位之後,諸如MapR-DB或MongoDB之類的文檔資料庫,MapR-ES或Apache Kafka之類的事件流式傳輸平台(諸如Kubernetes之類的編排工具),以及在Docker容器中實作用于建構和部署軟體的DevOps過程之後,人們必須了解應該在這些容器中部署哪些元件的問題。

6.微服務

從曆史上看,微服務的概念并不新鮮。如今的差異在于,啟用技術(NoSQL資料庫、事件流、容器編排)可以随着數千個微服務的建立而擴充。如果沒有這些

QQ号轉讓

資料存儲、事件流和架構編排的新方法,大規模微服務部署将不可能實作。管理大量資料、事件和容器執行個體所需的基礎設施将無法擴充到所需的級别。

微服務都是與提供靈活性有關。微服務通常由一個功能或一小組功能組成。工作的功能單元越小且越集中,建立、測試和部署服務就越容易。這些服務必須解耦,否則企業将失去具有靈活性的微服務承諾。微服務可以依賴于其他服務,但通常通過負載平衡的REST API或事件流。通過使用事件流,企業可以利用請求和響應主題輕松跟蹤事件的曆史記錄。由于整個請求流和請求中的所有資料都可以在任何時間點重播,是以這種方法對故障排除具有重大的益處。

由于微服務封裝了一小部分工作,并且由于它們彼此分離,是以随着時間的推移更換或幾乎沒有障礙地更新服務。在原有模式下,依賴像RPC這樣的緊密耦合意味着不得不關閉所有連接配接,然後重建立立它們。負載均衡是實作這些的一個大問題,因為人工配置使它們容易出錯。

7.功能即服務

正如人們已經看到微服務在行業中占據主導地位,是以人們也會看到無伺服器計算的興起或者可能更準确地将其稱為功能即服務(FaaS)。 FaaS以這樣一種方式建立微服務,即代碼可以包裝在輕量級架構中,内置于容器中,按需執行(基于某種觸發器),然後自動進行負載平衡,多虧有了輕量級架構。FaaS的美妙之處在于它讓開發人員幾乎完全專注于該功能。是以,FaaS看起來是微服務方法的合乎邏輯的結論。

觸發事件是FaaS的關鍵組成部分。沒有它,隻有在需要完成工作的情況下,才能調用功能和消耗資源。功能的自動調用使得FaaS真正具有價值。想象一下,每當有人讀取使用者的配置檔案時,都會有一個審計事件,這是一個必須運作以通知安全團隊的功能。更具體地說,它可能僅過濾出某些類型的記錄。它可以是具有選擇性的,畢竟它是一個完全可定制的業務功能。需要注意的是,使用像FaaS這樣的部署模型來完成這樣的工作流程非常簡單。

把事件放在一起

觸發服務背後的魔力實際上不過是事件流中的事件。某些類型的事件比其他事件更頻繁地用作觸發器,但是企業如果希望成為觸發器的事件都可能成為觸發器。觸發事件可以是文檔更新,對新文檔運作OCR過程,然後将OCR過程中的文本添加到NoSQL資料庫。如果人們以更有趣的方式思考,每當上傳圖像時,都可以通過機器學習架構進行圖像識别和評分。這裡沒有根本的限制。如果定義了一個觸發器事件,發生了一些事件,該事件觸發該功能,并且該功能完成其工作。

FaaS将成為采用微服務的下一個階段。然而,接近FaaS時必須考慮一個主要因素,那就是供應商鎖定。 FaaS隐藏了特定的存儲機制、特定的硬體基礎架構和編排,這對開發人員來說都是偉大的事情。但由于這種抽象,托管的FaaS産品是IT行業有史以來最大的供應商鎖定機會之一。由于這些API不是标準化的,是以從公共雲中的FaaS産品遷移幾乎是不可能的,不會丢失已經完成的近100%的工作。如果通過利用來自融合資料平台的事件以更有條理的方式接近FaaS,那麼在雲計算提供商之間移動将變得更加容易。