OpenAI釋出“宇宙”平台，用1000+訓練環境賦予AI“類人智力”

當人工智能領域大牛在西班牙nips會議酒店吃早餐的時候，open ai 宣布開源了其新平台“宇宙”（universe）。這家由伊隆·馬斯克資助的非赢利性ai開源組織，在周一的上午搞了個大新聞，相信nips的餐桌上一定熱鬧非凡。當然，open ai後續也在nips的會場展示了自己的成果。

open ai 聯合創始人greg brockman 在twitter上說道，“這個ai 訓練架構，是我們從open ai建立之初就在計劃着的”。可見open ai對這個平台的重視。

那麼這個敢以“宇宙”命名的 universe是個什麼東西呢？

openai官網的介紹是：universe軟體平台，通過全世界的遊戲、網頁和其它應用，來測量和訓練ai的普通智力。

在universe上，ai智能體像人一樣使用電腦：觀看視訊，并操作鍵盤和滑鼠（隻不過是虛拟的）。總而言之：人類可以在網絡上做的事情，universe都可以讓ai智能體經曆一遍，目的就是訓練智能體掌握類似于人類的“普通智力”。

如今的ai技術，已經使計算機能看、能聽和翻譯，還能産生圖像、聲音和文本，alphago甚至擊敗了李世石。

但是如今的ai技術仍然逃脫不了“窄ai”的範疇，也就是說，它可以在某一個特定領域達到超強表現，但是一旦超過這個領域，就無法工作。alphago能在圍棋上輕松赢過任何人，但是沒法去玩其他的棋類遊戲。

而universe平台，就是為了打破“窄ai”的樊籬而誕生的。其核心架構由 greg brockman, catherine olsson和alex ray三人一起建構。

openai創始人ilya sutskever在接受《連線》采訪時說道：“一個ai智能體就是應該能夠解決你扔給它的任何問題。”這聽起來有點過于大膽了，甚至有點“天方夜譚”。但sutskever将universe與imagenet作類比，他認為imagenet幫助計算機能夠像人一樣地“看見”，如今谷歌和facebook的衆多app已經可以做到這一點了，而universe要做的，就是将人工智能朝向每一個次元擴充。

早在今年4月，openai 釋出了一個名為gym的工具包，用來開發和比較增強學習算法，包括了衆多訓練環境（environments）。如今在universe上，任何一個程式都可以轉變成一個gym環境。

今天釋出的universe，可以在1000多個環境裡運作，包括flash 遊戲、浏覽器任務等。universe 搞定了 valve 和 microsoft這樣的遊戲巨頭，獲得了遊戲授權。

（universe平台的部分合作方）

其實在遊戲裡訓練智能體不是新鮮事兒，因為遊戲的内容是可控的，有清晰的獎懲機制，是以智能體在其中可以穩定地學習什麼可以做，什麼不可以做。比如加拿大阿爾伯塔大學提供了經典遊戲atari的學習環境，微軟則基于minecraft遊戲打造了malmo系統。

可以說，從訓練智能體這一點來看，視訊遊戲已經給真實世界帶來了積極的影響。

不過相比而言，universe不僅可以在衆多遊戲環境裡，還能在浏覽器任務等任何網絡環境裡運作，其覆寫面超過了以往任何同類系統。

deepmind之前建立了一個可以在atari遊戲裡訓練的智能體，并使用相似的技術來對谷歌全球資料中心網絡進行精細化訓練，以此來節省每年數百萬美金的成本支出。

craig quiter目前是otto公司的工程師，這家自動駕駛卡車公司今年夏天被uber收購。在任職otto之前，quiter曾參與過universe的開發工作，由于此前對該平台早已熟悉，他對 universe“省錢”的功能興緻勃勃，正在打造一個可以玩“俠盜獵車手v”遊戲的智能體。

目前otto的自動駕駛系統可以在相對平穩的環境下運作，但是在未來幾年，該公司希望可以随時對路上遭遇的惡劣狀況做出反應，而“俠盜獵車手v”裡此起彼伏的驚險車況，對于otto的自動駕駛系統是個很好的訓練素材。

sutskever表示，在長期看來，universe平台以後甚至可以用于“遷移學習”：智能體把一個場景中學到的東西應用到另一個場景。他表示目前已經在着手建立一些智能體，将一個賽車遊戲裡學到的東西，應用在新的遊戲裡。

OpenAI釋出“宇宙”平台，用1000+訓練環境賦予AI“類人智力”

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普