天天看點

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

對于ai開發者來說,本周可謂喜訊不斷。首先是谷歌釋出了全新的 tf.transform 元件,大大簡化了機器學習中的資料預處理問題;同時,從去年秋天開始傳聞的 gpu 雲端加速服務也終于在谷歌雲平台實作了;另外,微軟公司聯合劍橋大學在最近釋出的一篇論文中闡述了一個名為 deepcoder 的機器學習系統,據介紹,該系統擁有基礎程式設計能力,可以幫助不會寫代碼的人制作簡易程式。最後,我們推薦幾個本周内雷鋒網出品的“高能”開發者資源合集,祝各位周末愉快。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

在實際的機器學習開發中,開發者通常需要對資料集進行大量的耗時費力的預處理過程,以适應各種不同标準的機器學習模型(例如神經網絡)。

針對這一難題,谷歌于 22 日通過開發者部落格正式釋出了一個基于 tensorflow 的全新功能元件 —— tf.transform。它允許使用者在大規模資料處理架構中定義預處理流水線(preprocessing pipelines),同時使用者還可以将這些流水線導出,并将其作為 tensorflow 計算圖(tensorflow graph)的一部分。

除了便于資料的預處理之外,tf.transform 還允許使用者計算其資料集的統計概要(summary statistics)。對于每個機器學習項目的開發者而言,深刻了解其資料都非常重要,因為任何對底層資料做出的錯誤假設都可能會産生一些微妙的錯誤。通過更簡單和高效地計算資料的統計概要,tf.transform 可以幫助開發者更好地檢查他們關于原始資料和預處理資料的假設。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

微軟和劍橋大學的研究員近日釋出了一篇介紹“會程式設計的機器學習系統——deepcoder”的論文。論文中描述的 deepcoder 系統可以解決程式設計比賽所涉及到的基礎程式設計題目,為不會程式設計的人提供了制作簡易程式的可能。

據介紹, deepcoder 可以在一秒鐘之内寫出能夠跑通的程式,而且随着該系統引入更多的程式設計資料進行學習之後,它的程式設計能速度也會越來越快。但是,deepcoder 也存在自身的不足之處,那就是 deepcoder 隻能自動生成五行左右代的代碼程式。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

在萬衆期待中,google雲計算平台日前推出了支援雲端gpu加速服務的公開測試版,第一款支援的gpu型号是nvidia 的tesla k80,使google雲平台的性能獲得了巨大提升。現在,使用者可以在谷歌雲平台的三個地區玩轉基于nvidia gpu的虛拟機,包括美東1區(us-east1),東亞1區(asia-east1)和西歐1區(europe-west1)。據介紹,目前使用者最多可以在自定義的 google 雲計端虛拟機上連接配接将8個gpu(4塊k80的闆子),并且隻支援使用gcloud的指令行工具,但從下周起就可以雲終端ui界面來建立虛拟機了。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

近日,今日頭條算數中心執行總監劉志毅在日前于深圳北京大學彙豐商學院舉行的“資料之美”論壇上進行技術分享。分享中,劉志毅詳細介紹了今日頭條是如何做到,向每個讀者推送不一樣的、據稱是符合讀者每個人不同興趣的内容的技術過程。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

ring allreduce 本是 hpc (高性能計算)領域的一項技術。日前,百度矽谷 ai 實驗室已成功将其移植到深度學習平台,借此來加速 gpu 之間的資料傳輸速率。目前,在 gpu 并行計算中,它們之間的通信瓶頸是制約深度學習模型訓練速度的主要障礙之一。百度宣布,ring allreduce 算法的引入将移除該瓶頸,大幅提升多 gpu 和分布式計算環境下的深度學習模型運算效率。雷鋒網獲得消息,該技術已被百度成功應用于語音識别。

該算法以庫和 tensorflow 更新檔的形式向開發者開源,分别為 baidu-allreduce 和 tensorflow-allreduce,已在 github 上線。

下面送上三個本周内ai研習社釋出的對開發者有益的資源合集。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

資源1是國外大神總結的機器學習算法大合集,圖中幾乎包含了機器學習領域所有的常見算法。其中不但簡單介紹了每一種算法的大概含義,還整理了它們的常見應用和優缺點,各位開發者絕對不可錯過。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

資源2是2017年内與開發者密切相關的 17 場重磅的資料科學和ai 相關的重大學術會議,其中包括 aaai 2017、developerweek 和 domino 資料科學峰會在内的三場大會已經過去了,但還剩下 14 場沒開始的會議都有哪些呢?各位不妨了解下吧。

谷歌釋出 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社周刊

資源3是幾位機器學習專家總結的 ai 領域含金量最高的開源資料庫合集,從計算機視覺,自然語言文本和語音,以及網絡和地理空間資料等幾乎無所不有,總有一款适合你,各位開發者不妨試試吧。

本文作者:恒亮

繼續閱讀