天天看點

機器人即将迎來“ChatGPT時刻”的三個原因

作者:DeepTech深科技

自機器人誕生以來,該領域的從業者一直希望制造出可以完成各種家務的機器人。但長期以來,這隻是一個難以實作的夢想。

雖然機器人學家已經能夠讓機器人在實驗室裡做一些令人印象深刻的事情,比如跑酷,但這些任務通常需要在嚴格控制的環境中進行細緻的規劃。

這使得機器人很難在家裡可靠地工作,尤其是有兒童和寵物的家庭。此外,每間房子的構造都不一樣,還會有各種混亂的狀況出現。

機器人領域有一個著名的觀察結果,稱為莫拉維克悖論:人類覺得困難的東西對機器而言是容易的,而對人類來說容易的東西機器人卻很難完成。

現在有了人工智能,這種情況正在改變。機器人開始能夠完成折疊衣物和烹饪等任務,而不久前,這些任務還被視為是幾乎不可能完成的任務。

在最新一期《麻省理工科技評論》雜志的封面故事中,我研究了機器人領域是如何迎來它的轉折點的。

機器人研究領域出現了非常令人興奮的(技術)融合,這可能(隻是可能)會讓機器人走出實驗室,進入我們的家。

以下是機器人即将迎來“ChatGPT 時刻”的三個原因。

機器人即将迎來“ChatGPT時刻”的三個原因

廉價的硬體使研究更容易完成

機器人很貴。高度複雜的機器人起步就要數十萬美元,這使得大多數研究人員沒能力購買它們。例如,最早一批家用機器人 PR2,重達 200 公斤,售價 40 萬美元。

但新的、更便宜的機器人讓更多的研究人員能夠做一些很酷的事情。初創公司 Hello robot 開發并推出了一種名為 Stretch 的新機器人,價格約為 18000 美元,重約 22.6 公斤。

它有一個小的移動底座,一個挂着攝像頭的杆子,一個可調節的手臂,末端有一個吸盤,可以用控制器控制。

與此同時,美國斯坦福大學的一個團隊建構了一個名為 Mobile ALOHA(“低成本開源硬體遠端作業系統”的縮寫)的系統,該系統僅依靠 20 個人類示範和其他任務的資料就學會了烹饪蝦。

他們使用現成的元件拼湊出了價格更低的機器人,價格為數萬美元,而不是數十萬。

機器人即将迎來“ChatGPT時刻”的三個原因

人工智能正在幫助我們建構“機器人大腦”

這些新機器人的軟體有别于過去的機器人。由于人工智能的蓬勃發展,現在的研究重點正從讓昂貴的機器人變得更靈活,轉變為以神經網絡的形式建構“通用機器人大腦”。

機器人學家已經開始使用深度學習和神經網絡來建立系統,在環境中不斷練習和學習,并相應地調整它們的行為,而不是傳統的規劃和訓練。

2023 年夏天,谷歌推出了一款名為 RT-2 的視覺語言動作模型。該模型通過網絡文本和圖像以及自己的互動來獲得對世界的總體了解。它将這些資料轉化為機器人動作。

豐田研究所(Toyota Research Institute)、哥倫比亞大學和麻省理工學院的研究人員已經能夠借助一種名為模仿學習的人工智能學習技術和生成式人工智能,快速教機器人完成許多新任務。

他們相信自己已經找到了一種方法,将推動生成式人工智能技術從文本、圖像和視訊領域擴充到機器人運動領域。

許多人都在嘗試生成式人工智能。Covariant 是一家從 OpenAI 現已關閉的機器人研究部門剝離出來的機器人初創公司,它建立了一個名為 RFM-1 的多模态模型。

它可以接受文本、圖像、視訊、機器人指令或測量(資料)形式的提示。生成式人工智能使機器人既能了解指令,又能生成與這些任務相關的圖像或視訊。

機器人即将迎來“ChatGPT時刻”的三個原因

更多的資料,更多的技能

GPT-4 等大型人工智能模型的強大能力源于從網際網路上收集的大量資料。但這并不适用于機器人,因為機器人需要專門為機器人收集的資料。

它們需要如何打開洗衣機和冰箱的示範資料,還有如何拿起盤子,如何折疊衣物等等。目前這些資料非常稀缺,人類需要很長時間才能收集到。

谷歌 DeepMind 發起了一項名為“開放 X 化身協作”的新舉措,旨在改變這一現狀。

2023 年,該公司與 34 個研究實驗室,約 150 名研究人員合作,收集了 22 種不同機器人的資料,其中也包括 Hello robot 的 Stretch 機器人。

由此得到的資料集于 2023 年 10 月釋出,裡面的機器人展示了 527 種技能,如拿起東西、推動和移動。

機器人即将迎來“ChatGPT時刻”的三個原因

(來源:TOYOTA RESEARCH INSTITUTE)

早期迹象表明,更多的資料正在催生更智能的機器人。研究人員為機器人建構了兩個版本的模型,稱為 RT-X,可以在各個實驗室的計算機上本地運作,也可以通過網絡通路。

更大的、可通過網絡通路的模型是用網際網路資料預訓練的,以從大型語言和圖像模型中發展“視覺常識”,或對世界的基本了解。

當研究人員在許多不同的機器人上運作 RT-X 模型時,他們發現這些機器人學習技能的成功率比每個實驗室正在開發的系統高出 50%。

支援:Ren

營運/排版:何晨龍

繼續閱讀