雲栖号資訊:【 點選檢視更多行業資訊】
在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

如今,各種類型的企業都緻力于采用人工智能和機器學習項目,但要發揮其真正的潛力,則需要克服重大的技術障礙。雖然計算基礎設施通常是重點,但存儲設施也同樣重要。以下是對象存儲(而不是檔案或塊存儲)适用在加強人工智能和機器學習工作負載的三個主要原因:
1.可擴充性
當有大量不同的資料源可供學習時,采用人工智能和機器學習技術最有效。資料科學家利用這些豐富的資料來訓練領域模型。在“大資料的五個V”(數量、類型、速度、準确性和價值)中,前兩個(數量和類型)最為重要。簡而言之,人工智能和機器學習依賴于大量不同的資料(圖像、文本、結構化和半結構化資料)來建構有用的模型,提供準确的結果,并最終提供業務價值。
對象存儲是很具擴充性的存儲架構,特别适合支援人工智能和機器學習所需的大量資料。對象存儲旨在通過水準擴充方法實作無限增長,進而使企業可以通過在需要的位置和時間添加節點來增加部署。由于對象存儲使用單個全局名稱空間,是以也可以一次在多個地理位置上進行這種擴充。另一方面,檔案和塊系統通常采用擴充方法。這意味着這些平台通過向單個節點添加更多計算資源來實作垂直擴充,這最終會受到限制。他們無法通過部署其他節點來增加計算資源,進而無法有效地水準擴充。
2. API
健壯靈活的資料API對于人工智能和機器學習非常重要,如上所述,它們使用了多種資料類型。存儲平台需要支援API來容納各種資料。此外,人工智能和機器學習的創新越來越多地在公共雲上進行,但是仍然有相當一部分人工智能和機器學習在内部部署資料中心或私有雲中發生,這取決于用例的具體情況(例如,科學研究和醫療保健等領域通常最适合私有雲)。這意味着組織需要一個存儲API,以支援公共雲和本地/私有雲中的工作負載。
檔案和塊存儲平台所支援的API受限制,部分原因是它們是較舊的架構。相比之下,對象存儲使用雲平台中固有的進階API,該API設計為以應用程式為中心,與檔案和塊存儲相比,它支援範圍更廣的API,其中包括版本控制、生命周期管理、加密、對象鎖定和中繼資料。此外,支援人工智能和機器學習用例的新對象存儲API(例如對流資料的支援和對海量資料集的查詢的支援)也是可能的。
通過圍繞Amazon S3的對象存儲API的标準化,可以更輕松地在内部部署和公共雲中內建軟體。企業可以輕松地将人工智能和機器學習部署從内部部署/私有雲環境擴充到公共雲,或者将雲原生的人工智能和機器學習工作負載遷移到内部部署環境,而不會損失功能。這種雙模式方法使組織可以合作且可互換地利用内部部署/私有雲和公共雲資源。
由于S3 API已成為對象存儲的事實上的标準,是以許多軟體工具和庫都可以利用該API。這允許共享代碼、軟體和工具,以促進人工智能和機器學習社群中更快的開發。示例包括流行的機器學習平台,例如具有内置S3 API的TensorFlow和Apache Spark。
3.中繼資料
與API一樣,使用人工智能和機器學習的組織必須利用無限的可自定義的中繼資料,這一點至關重要。中繼資料隻是關于資料的資料,在最基本的層面上,是在何時何地建立的資料,以及是誰建立的資料。但是中繼資料可以描述更多内容:使用者可以建立任意的中繼資料标記來描述他們想要的任何屬性。
資料科學家需要豐富的中繼資料來查找特定資料以建構和使用其人工智能和機器學習模型。随着更多資訊添加到資料中,中繼資料注釋可逐漸積累知識。
檔案和塊存儲僅支援有限的中繼資料,例如上述基本屬性。這在很大程度上可以歸結為可擴充性,因為檔案和塊系統未配備快速無縫的增長功能,如果存儲系統支援依賴大量資料集的人工智能和機器學習應用程式的豐富中繼資料,則自然會發生這種情況。但是,對象存儲支援無限的、完全可自定義的中繼資料,進而使查找用于人工智能和機器學習算法的資料更加容易,并從中獲得更好的見解。
以一家醫院在X光圖像上使用圖像識别應用程式為例:使用中繼資料,可以使用TensorFlow模型分析添加到對象存儲系統中的每個圖像,然後為每個圖像配置設定更加精細的中繼資料标簽(例如,損傷類型、基于骨骼大小或生長的患者年齡或性别等)。TensorFlow模型可以在中繼資料上進行訓練,并對其進行分析,得出新的患者見解(例如與五年前相比,如今20歲到30歲的婦女患上的骨科疾病更多)。
幾乎每一家财富500強公司都在考慮采用人工智能和機器學習,可以想象這些技術将在可預見的将來成為最重要的企業IT計劃。然而,要使人工智能和機器學習計劃獲得回報,企業必須利用正确的存儲基礎設施。對象存儲由于其可擴充性、對各種API(特别是S3)的支援以及豐富的中繼資料,是人工智能和機器學習的優秀支柱。
【雲栖号線上課堂】每天都有産品技術專家分享!
課程位址:
https://yqh.aliyun.com/live立即加入社群,與專家面對面,及時了解課程最新動态!
【雲栖号線上課堂 社群】
https://c.tb.cn/F3.Z8gvnK
原文釋出時間:2020-06-02
本文作者: Gary Ogasawara
本文來自:“
企業網D1Net”,了解相關資訊可以關注“
”