天天看點

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

智東西(公衆号:zhidxcom)

作者 | 楊暢

編輯 | 三北

智東西4月29日報道,近日,亞馬遜雲科技在北京召開大資料與人工智能媒體溝通會,宣布推出“雲、數、智三位一體”的大資料與機器學習融合服務組合。亞馬遜雲科技還聯合樂我無限(Joyme)、上海欣兆陽(Convertlab)等合作夥伴分享了亞馬遜雲科技在助力企業數智融合方面的相關案例。

亞馬遜雲科技大中華區産品部總經理陳曉建談道,亞馬遜雲科技有兩個數智融合方面的重要理念:一是在雲中實作資料與智能的大融合将成為企業加速創新的引擎,二是企業應在雲中打造統一的資料基礎底座,實作大資料與機器學習的“雙劍合璧”,為企業發展提供新引擎。

亞馬遜雲科技大中華區産品部技術專家團隊總監王曉野詳細解析了亞馬遜雲科技的“智能湖倉”架構朝着深度智能方向的多項更新成果。

大資料與人工智能技術如何融合?亞馬遜雲科技在這方面進行過哪些研究和讨論?大資料與人工智能融合後,又能給企業使用者帶來哪些改變?本文對這些問題進行了深入探讨。

一、雲數智一體服務,應對機器學習落地三大挑戰

陳曉建說,随着企業的資料越來越多,機器學習模型越來越先進,很多企業希望通過大資料技術和機器學習技術的融合,進一步帶動企業的業務創新,提升企業産出。

但是,企業往往會面臨這樣一個困境:擁有大量的資料和分析計算,嘗試了多種先進的機器學習模型,不過很難有實際的業務産出。從技術發展趨勢來看,大資料技術和機器學習技術走的是不同路線,大資料看重資料本身的采集、優化,而機器學習技術看重算法本身的優化、調參。

陳曉建談道,具體來說企業的機器學習生産化面臨三方面的挑戰。一是大資料與機器學習分而治之,這兩部分往往是不同團隊負責,容易出現資料孤島、技術孤島,制約相關應用的靈活疊代。二是資料處理的能力不足,難以處理海量的業務資料,這制約着機器學習由實驗轉向實踐。三是資料分析人員的參與度低,研發測試階段表現不錯的算法模型,可能在實際使用中産生的效果不夠理想,因為真實環境的複雜度更高一些。

為此,亞馬遜雲科技推出了“雲、數、智三位一體”的服務組合。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

首先是要建構雲中統一的數字治理底座,打破資料與技能孤島。

亞馬遜雲科技通過幫助使用者建構統一的數字治理底座,實作使用者所用的大資料和機器學習應用的資料共享、資料權限的統一管控,以及兩者統一的開發和流程編排。

二是為機器學習提供生産級别的資料處理能力,助力機器學習由實驗轉為實踐。

亞馬遜雲科技能提供多種靈活可擴充、專門建構的大資料服務,助力使用者進行複雜的資料加工級處理,來應對資料規模的動态變化、優化資料品質。

三是讓資料分析智能化,賦能企業業務人員探索創新。亞馬遜雲科技為使用者提供更智能的資料分析服務,讓業務人員就可以完成智能分析、模型效果驗證以及自主式創新。

陳曉建說全球數十萬使用者都在使用亞馬遜雲科技的大資料及機器學習服務。

二、“智能湖倉”的深度智能能力再更新

去年亞馬遜雲科技推出了“智能湖倉”架構,為使用者提供相關的數智化服務。王曉野分享了從釋出到現在一年以來,亞馬遜雲科技的“智能湖倉”架構有了哪些新的變化。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

雲中統一的資料治理底座方面,亞馬遜雲科技的Amazon SageMaker Studio可以一站式地完成資料開發、模型及相關的生産任務,為大資料和機器學習提供統一的開發平台。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

亞馬遜雲科技還能提供Amazon Lake Formation,該應用新增了多個功能,可以幫助使用者實作資料網格跨部門的資料資産共享,以及基于單元格的最細粒度的權限控制機制。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

為機器學習提供生産級别的資料處理能力方面,亞馬遜雲科技有能夠支援多種開源架構的大資料平台Amazon Athena。Amazon Athena可以對Amazon EMR、高性能關系資料庫Amazon Aurora、NoSQL資料庫服務Amazon DynamoDB、Amazon Redshift等資料源的資料進行聯邦查詢,進而快速完成機器學習模組化的資料加工。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

亞馬遜雲科技還建構了無伺服器分析能力,包括Amazon Redshift、Amazon Managed Streaming for Apache Kafka (Amazon MSK)和 Amazon EMR等應用。這些可以讓使用者不需要配置、擴充或者管理底層的基礎設施就能處理任何規模的資料,為使用者的機器學習項目提供兼具性能和成本效益的特征資料準備。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

資料分析智能化方面,亞馬遜雲科技在日常分析工具中內建了機器學習模型預測能力,還提供如可視資料準備工具Amazon Glue Databrew、零代碼化的機器學習模型工具Amazon SageMaker Canvas等服務,讓業務人員探索機器學習模組化。

三、合作開發新應用,已獲多方收效

亞馬遜雲科技這次還邀請了樂我無限和上海欣兆陽這兩位合作夥伴的相關負責人來分享其與亞馬遜雲科技合作的背景、過程和成效。

樂我無限資料研發中心總監楊飛說,樂我無限營運的全球化直播平台LiveMe上面有來自200多個國家或地區的使用者,資料量非常大,而且還需要做到合規營運等。

亞馬遜雲科技推雲數智一體服務,秀智能湖倉成果

樂我無限基于亞馬遜雲科技的解決方案搭建了直播内容識别系統、欺詐交易識别系統。直播内容識别系統幫助樂我無限提升了使用者體驗,降低了内容管理的業務成本。樂我無限通過欺詐交易識别系統減少欺詐、拒付類交易,進而每年減少經濟損失可以達數百萬美元。

上海欣兆陽聯合創始人兼CTO李征談道,上海欣兆陽和亞馬遜雲科技在營銷數字化轉型方面進行了合作。上海欣兆陽是一家營銷雲廠商,能提供一體化營銷雲産品。

基于資料智能的營銷會給企業使用者帶來更多機會。人工智能讓以使用者為中心的營銷可以做到千人千面資訊的引導。但資料智能營銷解決方案還面臨多種雲上挑戰。一是資料治理與機器學習作業流程弱關聯,二是資料的處理與分析需要耗費大量精力,三是模型疊代、維護等管理層面的效率較低。

上海欣兆陽基于亞馬遜雲科技的統一的資料基礎底座,上海欣兆陽建構了一體化資料智能湖倉架構Data Hub和一體化高效機器學習平台AI Hub。這兩項應用能将資料流轉的時效性提升了32%,模型上線效率提升了30%。

結語:雲數智混合賦能産業數字化轉型

亞馬遜雲科技根據自身的實踐以及對行業的觀察,打造出了一套“雲、數、智三位一體”服務組合,為使用者提供融合人工智能和大資料的解決方案。

不止人工智能、大資料技術在賦能企業數字化轉型,更高效發展,還有如物聯網、數字孿生等等智能科技一起助推企業更好發展。

繼續閱讀