天天看點

【熱點】谷歌的AI協同平台

去年谷歌釋出了自己的AI內建化産品-AIHub,旨在解決當下資料科學從架構到落地的各種問題,包括各類分布式的算力資源(CPU, GPU, TPU,尤其在跨環境的情況,如将雲端負載轉移到本地那将是噩夢),資料科學團隊的協同(工具、模型和解決方案等的複用)以及跨團隊的協作--資料科學家不懂雲,雲架構師不懂特征工程,DBA不懂資料科學,而AIHub是谷歌推動企業資料科學協同的重要闆塊以及唯一的平台級工具。

【熱點】谷歌的AI協同平台

畢竟企業AI不光是資料科學家的事,還需要業務分析團隊從現有的資料中擷取洞見;應用開發團隊在程式中嵌入定制化機器學習模型的API;機器學習工程師建構CI/CD管道推動模型落地。當然還包括資料科學團隊來建設和部署機器學習模型。

既然建立企業AI能力涉及到這麼多角色和分工,勢必不同團隊需要功能不同但又互互相動的工具來協同工作。谷歌的AI技術棧自底向上包含了其雲平台的實體資源,包括存儲、計算與處理器,當然如果使用者有自己的資料中心,也可以與GCP內建或以docker形式建構上層谷歌的AI技術棧。

【熱點】谷歌的AI協同平台

基于GCP的雲架構,官方會推薦使用托管的容器雲服務,包括深度學習的專用虛拟機、AI平台的訓練環境、自動機器學習的IDE等。如果底層是本地資料中心可以通過谷歌的K8S引擎或開源版的K8S自行搭建工具層(Kubeflow)的核心服務。

工具層包括了資料科學家最首席的notebook工具,面向靈活開發的CI/CD管道(Kubeflow Pipeline)以及面向架構團隊可以按需分布AI負載的Kubeflow Fairing。

【熱點】谷歌的AI協同平台

這次釋出的AIHub相當于是所有AI工具的中心,面向各協作團隊提供了一站式搜尋、快速部署以及内外部共享的産品體驗。其中搜尋功能包括了面向即插即用的AI管道和Google合作夥伴和使用者建立的内容的快速搜尋;快速部署包括了在GCP上通過Kubeflow對AI管道的一鍵式部署;共享體驗包括了AI管道和制品的複用以及内容端的開放共享。

【熱點】谷歌的AI協同平台

下面我們聊聊針對不同的協作方,AIHub提供的使用者旅程。包括應用開發人員通過API部署智能應用;資料科學家通過AIHub發現、自定義、訓練并共享機器學習模型;機器學習工程師整合端到端的機器學習路徑形成AI産品。

首先對于開發人員來說,AIHub提供了各種開箱即用的認知服務接口,就像一個API超市一樣,可以在左邊欄選擇輸入的類别,例如圖像、文字、語音或視訊等,也可以根據接口類别來搜尋。

【熱點】谷歌的AI協同平台

我們拿之前微軟認知服務識别不出來的兩張圖檔來給谷歌做個測試,分别是恒隆廣場和易烊千玺,結果發現谷歌的計算機視覺可以識别出來!而在微軟的圖像識别裡僅能識别為一個建築和一個男孩......可見谷歌對中國大陸人物的圖像資源庫要比微軟更完備,哪怕它被中國大陸所封禁。

【熱點】谷歌的AI協同平台
【熱點】谷歌的AI協同平台

對于API調用的便利性,經過小編的體驗,跟微軟的認知服務配置差不多,一鍵啟用自動機器學習,然後安裝gcloud工具,同樣需要輸入秘鑰并配置谷歌服務賬戶。

針對資料科學團隊,AIHub頁面裡內建了Tensorflow的編譯器,可以直接對訓練模型進行校正(Kubeflow Fairing内含各種通用的卷積算法和歸類算法),也可以将notebook分享給團隊其他科學家以供校驗。

【熱點】谷歌的AI協同平台

對于機器學習工程師,他們并沒有數學科學家的模組化水準,他們更關注資料的輸入和模型的輸出及産品化,他們可以設計子產品間的邏輯,前序輸入、後續輸出等等。通過Kubeflow Pipeline可以很友善地以拖拉拽的形式完成運算邏輯。

【熱點】谷歌的AI協同平台

目前為止,埃森哲、英特爾、英偉達、思科等的雲服務都是基于谷歌的AIHub和認知服務開發的自己的人工智能能力。

繼續閱讀