天天看點

資料保護平台如何為新一代應用,人工智能和資料科學提供動力資料保護如何成為一個全面的資料平台這些平台和資料湖有什麼共同點使資料保護平台正常工作

我最堅信的信念之一是,通過有效地建構,管理和發展其資料供應鍊來學習如何充分利用其資料的公司将獲得持久的競争優勢。現在擁有如此多的資料,公司必須将其資料視為其最有價值的資産之一。這些資料供應鍊必須像其他任何系統或分發網絡一樣平穩運作。

然而,資料供應鍊提出了獨特的挑戰。要使資料供應鍊無縫運作非常困難,因為它必須從許多來源收集資料,将其提煉成有用的形式,然後能夠根據需要将特定的子集傳遞給業務。資料不是萬能的,是以您的資料供應鍊必須像資料多樣化一樣靈活。

為了建構最佳的資料供應鍊,公司應識别其庫存中已擁有的資産。這是他們經常忽略的倉庫,因為幾乎每家公司都有一個存儲庫,可悲的是,它沒有充分利用作為業務洞察力的來源:備份。

備份不僅需要放在架子上,而且僅在其他資料丢失時才可以拉入。實際上,它們可以推動創新。怎麼樣?好了,現在所謂的資料保護的整個過程變得更加複雜。在本故事中,我們将以Commvault為例,說明資料保護系統如何建立一個集中而全面的資料存儲庫,該存儲庫不僅可以用作備份,還可以成為使用資料存儲新方法的基礎。創造價值。

換句話說,我們将探索現代資料保護平台如何幫助您建構和運作支援新類型的應用程式,人工智能和資料科學的資料供應鍊。

資料保護如何成為一個全面的資料平台

過去,資料保護全都與備份有關。我們都記得軟碟,以及80年代後期的高科技電影如何無法避免涉及備份狀态的戲劇性變化。但是對于大型企業而言,備份已成為一種重要的保險形式。整個備份系統作為最壞的情況設定存在,是一種将資料傳輸到安全位置然後在出現問題時進行恢複的方法。

但是我們需要擴充對備份的看法,以趕上當今的技術。在現代世界中,資料保護平台在以下方面已遠遠超越了傳統備份。

建立中繼資料目錄

今天,捕獲了大量的中繼資料,是以公司對資料的來源和使用方式有了更多的了解。這些目錄可以幫助公司:

  • 分析資料使用
  • 了解資料增長
  • 追蹤資料
  • 觀察和監視資料蔓延
  • 建立門檻值并發出有關容量限制的警報
  • 使用REST API将資料添加到動态索引(例如,将GPS資料添加到資産等實體)

使用資料爬網

資料保護平台還可以幫助公司抓取資料并建立業務中任何人都可以使用的結果的索引,以查找和分類人員,産品,位置和其他重要資訊,例如:

  • 實體識别和提取
  • 收集與特定分析或AI使用相關的資料
  • 識别合規所需的資料

在資料内建立更好的搜尋功能

資料保護平台可以建立反向索引,以使其資料更易于搜尋。Commvault的動态索引建立了這樣的索引,以使搜尋速度更快。

充當轉換引擎

平台内的資料可幫助推動整個企業的創新,因為它的可通路性使使用者從資料科學到開發都可以:

  • 使用資料屏蔽
  • 對雲資料執行實時開發/測試
  • 在資料上使用适當的編輯技術,同時仍可以使用實時且相關的資料

作為工作流引擎運作

一旦平台完全投入營運,公司就可以使用可視化編碼和簡化方法建立工作流程,以自動化加快流程,包括标準工作流程和流程以及與票務系統等平台的第三方內建。

分析一段時間内的資料使用情況

最後,由于資料保護平台的性質,使用者可以跨時間擷取同一資料集的多個視點,以檢視發生了什麼。這樣的時間分析提供了寶貴的見解。

這些平台和資料湖有什麼共同點

當我們看一下像Commvault這樣的資料保護平台提供的功能時,我們看到它具有人們一直在努力從資料湖項目中擷取的許多屬性,例如:

  • 所有重要資料都儲存在具有公共中繼資料層的存儲庫中
  • 確定資料被索引和可搜尋
  • 運作轉換作業以分析和提取資料,以及使用工作流引擎管理此類作業的執行能力
  • 通過API通路資料,支援處理和檢索

當然,資料保護平台缺少資料湖的一些關鍵方面,例如用于建立和運作進階分析的程式設計模型,以及建立新引擎(如SQL引擎和其他在Hadoop上運作的機器學習技術)的能力。

但是,當您将資料保護平台作為資料基礎架構的一部分時,您會在資料供應鍊中獲得極為強大的元件。這些平台可能無法執行所有操作,但是它們卻可以執行很多操作,而且沒有一個資料存儲庫可以實際為公司提供所需的一切。

使資料保護平台正常工作

現在,讓我們想象一下如何通過資料保護平台使應用程式,人工智能和資料科學變得更加強大。這些平台提供了這些。

了解你所擁有的

您具有資料的全面視圖和索引。您無需再猜測擁有什麼和缺少什麼了。例如,當您在應用程式中并想了解有關客戶的所有資訊時,或者在資料科學環境中并且需要有關資料的環境時,這可能會有所幫助。平台提供了有助于了解的中繼資料存儲庫。

獲得對所有資料的通路權限

由于其在提供資料恢複方面的基礎,是以資料保護平台擁有您的所有資料。一旦您了解了特定資料集中可能存在的有趣内容,該平台就可以使您直接通路資料本身,而不僅僅是中繼資料。這是一個巨大的優勢,因為您可以通路很多本來無法通路的資料。這加快了結果的速度,因為應用程式,人工智能和資料科學家無需等待資料傳遞就可以了,因為它随時可用。

提取金塊

資料保護平台突破了障礙。我們都知道,某些資料比其他資料更難尋找和挖掘價值。通過将所有資料整合到一個位置,這些裝飾資料變得更易于管理。例如,如果要在資料中查找提到産品或客戶的所有位置,則可以在平台上進行爬網并檢索相關資料,然後将其用于分析,應用程式或AI。

時光倒流

如前所述,公司從資料保護平台中獲得的時間分析非常寶貴。您可以檢視資料如何随時間變化,監視關鍵趨勢,記錄和跟蹤更改以及根據此資訊執行分析,進而可以根據曆史資料做出更好的決策。

執行中繼資料分析

同樣的時間分析也可以用于您的中繼資料。公司可以回顧所有中繼資料,了解資料集之間的變化和關系,以及誰通路了資料以及何時才能更好地了解企業中最重要的資料。

備份計劃絕不算什麼

資料保護平台的偉大之處在于它是自動建立和更新的。公司仍然需要處理資料以将其提取并使用,但是使用這樣的平台,您将可以從一個強大而強大的視圖開始,一次檢視企業中所有重要資料。

資料保護平台可立即通路大量曆史資料,這些曆史資料可以為您的資料供應鍊增加未開發的次元。我認為,有權通路資料保護平台的應用程式開發人員,人工智能專家和資料科學家将壓垮那些無法通路該平台的人。

繼續閱讀