天天看點

亞馬遜雲科技釋出全新資料管理服務Amazon DataZone

作者:199IT網際網路資料

亞馬遜雲科技在2022 re:Invent全球大會上宣布,推出一項全新的資料管理服務Amazon DataZone,它可以讓客戶更快、更輕松地對存儲在亞馬遜雲科技、客戶本地和第三方來源的資料進行編目、發現、共享和治理。借助Amazon DataZone,管理者和資料資産管理者可以使用精細的控制工具管理和治理資料通路權限,確定資料通路發生在正确的權限和正确的情境之下。Amazon DataZone使工程師、資料科學家、産品經理、分析師和業務使用者可以輕松通路整個組織的資料,進而發現、使用資料,通過資料進行協作來獲得洞察。想要了解更多請通路aws.amazon.com/datazone。

目前,企業收集的資料達到PB甚至EB級别,這些資料來自多個部門、多項雲服務、衆多本地資料庫以及第三方資料源(如來自合作夥伴解決方案和公共資料集)。在企業可以釋放資料的全部價值之前,管理者和資料管理者作為資料生産者與管理者,需要在保障資料的管控和治理的前提下允許資料通路,確定資料隻能由正确的人在正确的情境下通路。另一方面,整個公司的員工(如資料消費者)都希望發現和分析來自資料生産者的資訊,以推動決策制定。資料需要被管控以保證安全,産生新的洞察需要允許資料通路,企業必須在二者之間尋求平衡。然而企業内資料多樣,部門林立,用例不同,這些都對治理政策的落實提出挑戰。一些企業通過建立目錄來管理資訊,但這些目錄系統維護起來相當耗時,需要資料生産者手動标記每個資料集,額外添加來源或描述等情境資訊來保證資料可以被檢索和發現,同時缺乏内嵌的通路控制來簡化資料治理。企業很難保持資料分級分類的一緻性,以及各個資料生産者必須保持自己的資訊實時更新,這使得在整個企業中搜尋資料變得非常困難,并可能導緻資料過時。在這種情況下,資料消費者即使找到了所需資訊,也無法快速通過目錄直接向資料所有者請求通路權限,也就無法加載資料分析服務以及與他人協作。最終,決策者無法及時獲得所需資訊,或者可能根據不完整或過時的資料做出欠佳的決策。

Amazon DataZone是一種全新的資料管理服務,它助力資料生産者輕松管理和控制資料通路,使資料消費者能夠發現和使用資料、開展資料協作以擷取業務洞察。資料生産者可以通過Amazon DataZone定義資料分級分類,配置治理政策,連接配接一系列亞馬遜雲科技服務(如Amazon S3和Amazon Redshift)、合作夥伴解決方案(如Salesforce和ServiceNow)和本地系統,進而建立自己的業務資料目錄。Amazon DataZone使用機器學習為每個資料集收集和建議中繼資料資訊(如資料來源和資料類型),并根據客戶的分級分類和偏好進行模型訓練,不斷優化,進而消除資料目錄維護的繁重工作。設定目錄後,資料消費者可以使用 Amazon DataZone搜尋和發現資料資産,檢查中繼資料使用情境,請求資料集通路權限。當資料消費者開始分析資料,他們會建立一個Amazon DataZone資料項目,即門戶系統中的一個共享空間,使用者可以在其中提取不同的資料集、與同僚共享通路權限、進行分析協作。Amazon DataZone與Amazon Redshift、Amazon Athena和Amazon QuickSight等亞馬遜雲科技資料分析服務進行了內建,資料消費者能夠在其資料項目的情境中通路這些服務,他們的資料在這些服務中自動可用、無需單獨的登入憑證。Amazon DataZone還提供應用程式程式設計接口(API)以與自定義解決方案或與DataBricks、Snowflake和Tableau等合作夥伴進行內建,是以,客戶可以輕松釋出、搜尋和使用其所有的資料資産。

“良好的治理是整個組織都可以通路資料的基礎,但我們經常聽客戶說,在使資料可發現和保持控制之間很難取得适當的平衡。”亞馬遜雲科技資料庫、資料分析和機器學習副總裁Swami Sivasubramanian表示,“借助 Amazon DataZone,客戶可以使用單一服務在強大的治理控制和簡化的資料通路之間取得平衡,進而輕松查找、組織資料,使用資料進行協作。Amazon DataZone在整個企業内解放了資料的束縛,每個員工都可以幫助推動擷取新的洞察,最大限度地發揮資料價值。”

ENGIE是一家全球能源公司,專注于可再生能源和分布式低碳能源基礎設施,幫助客戶實作脫碳目标。“我們ENGIE的主要優先事項是統一所有業務的資料,允許資料共享,以提高績效,大規模創造價值。為了實作這一目标,我們在内部建構了公共資料平台,這在很大程度上解決了這一挑戰。”Data@ENGIE首席技術官Gregory Wolowiec表示,“我們沒有自建和維護一個平台來進行資料共享和治理。在過去六個月裡,我們作為測試版本客戶,一直與Amazon DataZone團隊合作,為建立這項亞馬遜雲科技原生服務提供意見。我們期待着使用Amazon DataZone在整個公司内共享資料,簡化對亞馬遜雲科技分析服務和治理工具的通路。這将使我們的分析師和業務線上司能夠開啟創新項目,根據資料驅動做出決策。我們很高興将Amazon DataZone融入到我們的業務營運,利用其強大的功能實作資料共享,利用大資料創造價值。”

福克斯公司是一家領先的内容制作商和發行商,旗下擁有體育、新聞和娛樂等品牌。“在福克斯,統一所有的業務資料,打造安全、可信、規模化的資料發現、釋出、通路和共享能力至關重要。我們希望業務團隊能夠安全地發現和共享資料,無需做深入的技術工作。”福克斯公司資料基礎設施副總裁Alex Tverdohleb表示,“Amazon DataZone有助于我們簡化、自動化資料發現和共享,保持适當的資料治理,是以我們可以確定在正确的時間使用正确的工具通路資料。”

伊塔烏聯合銀行(Itaú)是一家全球金融服務公司,也是拉丁美洲最大的私營金融機構。“打造資料驅動力是我們的主要企業目标之一,但我們在使用亞馬遜雲科技分析服務的過程中,必須不斷平衡資料通路與治理及合規政策之間的關系,這使得團隊難以快速行動。”伊塔烏聯合銀行資料和分析工程平台負責人Roberto Figueira表示,“我們很高興能夠測試使用Amazon DataZone,因為它将簡化資料治理,使跨業務部門的資料通路變得更容易。借助Amazon DataZone,我們将能夠快速輕松地為分析師、工程師和資料科學家團隊設定精細的通路權限,幫助他們在各種業務場景中驗證資料假設。”

繼續閱讀