天天看點

OpenAI釋出“宇宙”平台,用1000+訓練環境賦予AI“類人智力”

當人工智能領域大牛在西班牙nips會議酒店吃早餐的時候,open ai 宣布開源了其新平台“宇宙”(universe)。這家由伊隆·馬斯克資助的非赢利性ai開源組織,在周一的上午搞了個大新聞,相信nips的餐桌上一定熱鬧非凡。當然,open ai後續也在nips的會場展示了自己的成果。

open ai 聯合創始人greg brockman 在twitter上說道,“這個ai 訓練架構,是我們從open ai建立之初就在計劃着的”。可見open ai對這個平台的重視。

OpenAI釋出“宇宙”平台,用1000+訓練環境賦予AI“類人智力”

那麼這個敢以“宇宙”命名的 universe是個什麼東西呢?

openai官網的介紹是:universe軟體平台,通過全世界的遊戲、網頁和其它應用,來測量和訓練ai的普通智力。

在universe上,ai智能體像人一樣使用電腦:觀看視訊,并操作鍵盤和滑鼠(隻不過是虛拟的)。總而言之:人類可以在網絡上做的事情,universe都可以讓ai智能體經曆一遍,目的就是訓練智能體掌握類似于人類的“普通智力”。

OpenAI釋出“宇宙”平台,用1000+訓練環境賦予AI“類人智力”

如今的ai技術,已經使計算機能看、能聽和翻譯,還能産生圖像、聲音和文本,alphago甚至擊敗了李世石。

但是如今的ai技術仍然逃脫不了“窄ai”的範疇,也就是說,它可以在某一個特定領域達到超強表現,但是一旦超過這個領域,就無法工作。alphago能在圍棋上輕松赢過任何人,但是沒法去玩其他的棋類遊戲。

而universe平台,就是為了打破“窄ai”的樊籬而誕生的。其核心架構由 greg brockman, catherine olsson和alex ray三人一起建構。

openai創始人ilya sutskever在接受《連線》采訪時說道:“一個ai智能體就是應該能夠解決你扔給它的任何問題。”這聽起來有點過于大膽了,甚至有點“天方夜譚”。但sutskever将universe與imagenet作類比,他認為imagenet幫助計算機能夠像人一樣地“看見”,如今谷歌和facebook的衆多app已經可以做到這一點了,而universe要做的,就是将人工智能朝向每一個次元擴充。

早在今年4月,openai 釋出了一個名為gym的工具包,用來開發和比較增強學習算法,包括了衆多訓練環境(environments)。如今在universe上,任何一個程式都可以轉變成一個gym環境。

今天釋出的universe,可以在1000多個環境裡運作,包括flash 遊戲、浏覽器任務等。universe 搞定了 valve 和 microsoft這樣的遊戲巨頭,獲得了遊戲授權。

OpenAI釋出“宇宙”平台,用1000+訓練環境賦予AI“類人智力”

(universe平台的部分合作方)

其實在遊戲裡訓練智能體不是新鮮事兒,因為遊戲的内容是可控的,有清晰的獎懲機制,是以智能體在其中可以穩定地學習什麼可以做,什麼不可以做。比如加拿大阿爾伯塔大學提供了經典遊戲atari的學習環境,微軟則基于minecraft遊戲打造了malmo系統。

可以說,從訓練智能體這一點來看,視訊遊戲已經給真實世界帶來了積極的影響。

不過相比而言,universe不僅可以在衆多遊戲環境裡,還能在浏覽器任務等任何網絡環境裡運作,其覆寫面超過了以往任何同類系統。

deepmind之前建立了一個可以在atari遊戲裡訓練的智能體,并使用相似的技術來對谷歌全球資料中心網絡進行精細化訓練,以此來節省每年數百萬美金的成本支出。

craig quiter目前是otto公司的工程師,這家自動駕駛卡車公司今年夏天被uber收購。 在任職otto之前,quiter曾參與過universe的開發工作,由于此前對該平台早已熟悉,他對 universe“省錢”的功能興緻勃勃,正在打造一個可以玩“俠盜獵車手v”遊戲的智能體。

OpenAI釋出“宇宙”平台,用1000+訓練環境賦予AI“類人智力”

目前otto的自動駕駛系統可以在相對平穩的環境下運作,但是在未來幾年,該公司希望可以随時對路上遭遇的惡劣狀況做出反應,而“俠盜獵車手v”裡此起彼伏的驚險車況,對于otto的自動駕駛系統是個很好的訓練素材。

sutskever表示,在長期看來,universe平台以後甚至可以用于“遷移學習”:智能體把一個場景中學到的東西應用到另一個場景。他表示目前已經在着手建立一些智能體,将一個賽車遊戲裡學到的東西,應用在新的遊戲裡。

繼續閱讀