天天看點

Elon Musk揭OpenAI研究新突破, 可在VR中自我學習的機器人(附論文)

Elon Musk揭OpenAI研究新突破, 可在VR中自我學習的機器人(附論文)

大資料文摘作品,轉載具體要求見文末

編譯 | Aileen 錢天培

導讀:伊隆·馬斯克(Elon Musk)作為聯合創始人創辦的非盈利人工智能研究公司OpenAI在不久前宣布:他們新研究出了一款能夠自主學習完成實際生活任務的人工智能系統,而它所需的學習資料僅僅是該任務在虛拟環境中的一次示範。

相關論文可以在大資料文摘背景(訂閱号-大資料文摘-輸入關鍵字)回複關鍵字“OpenAI”擷取。

就在剛剛Elon Musk的一條推特又激起千層波(哪次不是呢…?):

Elon Musk揭OpenAI研究新突破, 可在VR中自我學習的機器人(附論文)

OpenAI建立了一個機器人系統,完全在仿真中進行了訓練,并部署在實體機器人上,機器人可以在看到任務完成一次之後就能學會執行這個新任務。

上個月,Elon Musk上司的OpenAI展示了這個機器人的早期版本,在那裡他們使用域随機化(domain randomization)對其視覺系統進行了教育訓練,即通過使用各種顔色,背景和紋理顯示模拟對象,而不使用任何真實圖像。

現在,OpenAI開發并部署了一種新的算法,一次性模仿學習,讓人們通過在VR中執行它來傳達如何做一個新的任務。給定一個示範,機器人能夠從任意的起始配置中解決相同的任務。

最聰明的機器人:隻看一次就可複制行為

如果說模仿是最真誠的奉承的話,那OpenAI最新的機器人系統可是給人類拍足了馬屁。隻需觀看一次展示,它就能成功複制人類的行為。這個由伊隆·馬斯克合夥創立并掌舵的科研公司使用了兩個分開的神經網絡--視覺網絡(vision network )和模仿網絡(imitation network),開發出了這個“一次就中”的模仿學習系統。

首先,機器人運用一個視覺網絡分析其攝像儀所見圖像,用以确定實際物體所在位置(以視訊中OpenAI的展示為例,這些物體就是桌上的木塊)。雖然這一網絡此前從未觀測過真實的桌子和木塊,它也能夠完成這一識别。研究者們用數以千計的模拟圖像替代實際觀測來訓練這一網絡,而每一張圖像代表了不同的燈光、材質以及物體的組合。

其次,機器人用一個模仿網絡來決定人類在虛拟展示中所完成任務的意圖。之後它就能在現實生活中完成這一任務了。同樣的,這一網絡的訓練用到了成千上萬的虛拟展示,但沒有一個展示是實際發生的。

(視訊全長2份51秒,請在WiFi條件下觀看)

視訊内容

當這一體統被要求在現實中模仿一個虛拟展示時,它能夠在觀看一次展示之後就完成模仿任務。更厲害的是,即便任務的啟示參數與展示中的不盡相同,它也能夠順利完成。比方說,在堆木塊任務的學習中,此系統不需要那些木塊被放在與展示中完全相同的位置。如果在展示中,藍色的木塊被堆在了白木塊的上面,那麼這系統就會複制這一做法——即便這些木塊被放到了不同的位置。

新的學習方式

與Elon Musk的衆多其他事業不同(如特斯拉,SpaceX),OpenAI是一個非營利組織。其目的不是賺錢,而是支援和引導人工智能創新。在這方面,它已經相當成功。

12月,該公司推出了一個開源平台Universe,使用者可以使用遊戲,網絡浏覽器和各種軟體來測量和訓練AI。本質上,該平台使AI能夠複制人類如何使用計算機,這使得開發人員能夠訓練其系統來完成人類可以執行的任何基于計算機的任務。

Elon Musk揭OpenAI研究新突破, 可在VR中自我學習的機器人(附論文)

本周,OpenAI跟進釋出了Roboschool,用于機器人仿真的開源軟體。它具有十幾個使用者可以測試他們的機器人的環境,它與OpenAI Gym(一個工具包)內建在一起,它使開發人員能夠釋出和接收對研究工作的回報,為他們提供一個支援AI開發的線上社群。

Elon Musk揭OpenAI研究新突破, 可在VR中自我學習的機器人(附論文)

除了OpenAI,研究人員已經在尋找方法來教導機器人做各種事情: 從閱讀到做夢。他們建立了可以自己學習的AI系統,甚至可以互相教授的AI系統。教育正在從根本上被颠覆,以滿足這項新技術的需求,随着我們的機器夥伴的智慧化,我們的生活将變得更加輕松,更安全,而且更有趣。

相關論文可以在大資料文摘背景(訂閱号-大資料文摘-輸入關鍵字)回複關鍵字“OpenAI”擷取。

來源:https://blog.openai.com/robots-that-learn/,https://blog.openai.com/roboschool/

關于轉載如需轉載,請在開篇顯著位置注明作者和出處(轉自:大資料文摘 | bigdatadigest),并在文章結尾放置大資料文摘醒目二維碼。無原創辨別文章請按照轉載要求編輯,可直接轉載,轉載後請将轉載連結發送給我們;有原創辨別文章,請發送【文章名稱-待授權公衆号名稱及ID】給我們申請白名單授權。未經許可的轉載以及改編者,我們将依法追究其法律責任。聯系郵箱:[email protected]