機器之心報道
編輯:陳萍、大盤雞
機器人忙碌的一天。
這年頭,機器人真的要成精了,帶回家後是個做家務的小能手。
烹饪幾道美食手到拈來,一會兒功夫速成大餐:滑蛋蝦仁、蚝油生菜、幹貝燒雞,不知道的還以為是真人廚師做成的:
備菜環節也是做的有模有樣,隻見它熟練的拿出一顆生菜切掉根部,然後輕輕的敲打雞蛋放入碗中:
打蛋環節還知道要把蛋殼丢到一邊,看樣子是個講究的機器人,再也不怕吃煎蛋時意外吃到蛋殼的驚吓了:
煎炒環節機器人進行不停地翻炒,以免糊鍋:
還不忘給蚝油生菜注入靈魂蒜末。這次咱不用菜刀拍蒜,普通的水果刀也能切出蒜泥來,可見刀功了得:
最後将做好的醬汁淋到生菜上,一道色香味俱全的家常菜就完美出盤:
你以為機器人會做美食就已經是它的極限了,你不知道的是,它打掃起房間來也是一把好手。
早晨起來給陽台的綠植澆澆水,即使出差在外,也不怕花花草草們「渴死」:
眼裡時刻有活兒,地闆髒了就拖拖地:
用膠囊咖啡機沖泡一杯咖啡,讓你用百分百精力開始今天的工作:
幫男生刮胡子,如果力道拿捏不準,這活還真不敢交給機器人:
貓主子也不再孤單,家裡又多一位「鏟屎官」陪它玩耍:
衣服髒了,還會幫你洗衣服,打開、擰好洗衣液蓋子都是憑自己的本事完成的:
就連套枕套這樣的技術活,也難不倒它:
将洗好的衣服進行懸挂,機器人能精準地找到拉鍊,把拉鍊扣扣在一起,幫你拉好衣服,然後懸挂起來:
當衆給大家表演一個如何開瓶蓋:
睡覺時間幫你掖好被子,熄燈晚安。機器人的一天總算是結束了。
看到這,真的不敢相信這是機器人可以做到的,妥妥一個全職管家。
這款機器人的名字叫 Mobile ALOHA,研究團隊來自斯坦福,由三個人共同打造完成。
其中,Zipeng Fu 為項目共同負責人,他是斯坦福大學 AI 實驗室的計算機科學博士生,師從 Chelsea Finn 教授;Tony Z. Zhao 也是斯坦福大學的計算機科學博士生,導師也是 Chelsea Finn。他們三個人共同完成了這項研究。
根據機器人的材料清單來看,這款機器人的總成本約為 32000 美元,折合人民币約 22 萬,軟體和硬體全部開源。
材料清單
研究介紹
在機器人技術領域,從人類示範中進行的模仿學習已經取得了令人矚目的成績。然而,大多數成果都集中在桌面操作上,缺乏完成一般任務的移動性和靈活性。那這位價值 32000 美元(約 22 萬元)的私人管家兼「禦用」大廚是怎麼完成這些靈活且細緻的工作的呢?我們一起看看隐藏在它背後的技術細節。
在這項工作中,研究者開發了一套系統,用于模仿需要全身控制的雙臂移動操作任務。用于資料收集的全身遠端操縱系統是移動 ALOHA。它通過一個移動底座和一個全身遠端操作界面增強了 ALOHA 系統。利用 Mobile ALOHA 收集的資料,該研究進行了有監督的行為克隆,并發現與現有靜态 ALOHA 資料集進行聯合訓練可提高移動操作任務的性能。
通過對每個任務進行 50 次示範,聯合訓練可将成功率提高 90%,進而使 Mobile ALOHA 能夠自主完成複雜的移動操作任務,例如炒蝦、打開雙門壁櫃存放沉重的烹饪鍋、呼叫并進入電梯以及使用廚房水龍頭輕輕沖洗用過的平底鍋。
- 論文位址:https://mobile-aloha.github.io/resources/mobile-aloha.pdf
- 項目位址:https://mobile-aloha.github.io/
- 技術文檔:https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc/edit
Mobile ALOHA 硬體
Mobile ALOHA 是一種低成本的移動機械手,可以執行各種家庭任務。Mobile ALOHA 繼承了原始 ALOHA 系統的優點,即低成本、靈巧、可維修的雙臂遠端操作裝置,同時将其功能擴充到桌面操作之外。研究者在研究過程中重點考慮了四個關鍵因素
1. 移動性:移動速度與人類行走速度相當,約為 1.42 米 / 秒。
2. 穩定性:在操作重型家用物品時它能保持穩定,如鍋和櫥櫃。
3. 全身遙控操作:所有自由度均可同時進行遙控操作,包括雙臂和移動底座。
4. 無繩:具有機載電源和計算裝置
圖 2(左)展示了研究者發現将操作員的腰部與移動底座系在一起的設計是最簡單直接的解決方案。
圖 2(中)中的資料表明,機械手相對于地面的垂直高度為 65 厘米至 200 厘米,可伸出底座 100 厘米,可舉起 1.5 千克重的物體,并可在 1.5 米高處施加 100 牛的拉力。這樣的設計讓 Mobile ALOHA 可以完成很多任務,包括實物烹饪、家務管理、人機互動等。
圖 2(右)中列出了 Mobile ALOHA 的更多技術規格。除了現成的機器人外,研究者還開源了所有的軟體和硬體部件,并提供了詳細的教程,包括三維列印、組裝和軟體安裝。我們可以在項目頁面找到這些資訊。
利用靜态 ALOHA 資料進行聯合訓練
研究者在這項工作中使用聯合訓練 pipeline,利用現有的靜态 ALOHA 資料集來提高移動操作的模仿學習性能,尤其是雙臂動作。靜态 ALOHA 資料集總共有 825 個示範動作,任務包括密封密封袋、拿起叉子、包裝糖果、撕紙巾、打開帶蓋塑膠瓶、玩乒乓球、分發膠帶、使用咖啡機、交接鉛筆和操作螺絲刀等。
需要注意的是,靜态 ALOHA 資料都是在黑色桌面上收集的,兩隻手臂固定朝向對方。這種設定與移動 ALOHA 不同,移動 ALOHA 的背景會随着移動底座的變化而變化,兩臂平行朝前放置。在聯合訓練中,研究者沒有對靜态 ALOHA 資料中的 RGB 觀察結果或雙臂動作使用任何特殊的資料處理技術。
任務
研究者選擇了 7 個任務,它們涵蓋了現實應用中可能出現的各種功能、對象和互動。圖 3 舉例說明了這些任務,它們分别是擦拭葡萄酒、煮蝦、沖洗鍋、使用櫥櫃、呼叫電梯、推椅子和擊掌。
實驗
實驗的目的是回答兩個核心問題:
(1)Mobile ALOHA 能否通過協同訓練和少量的移動操控資料獲得複雜的移動操控技能?
(2)Mobile ALOHA 是否可以與不同類型的模仿學習一起使用,包括 ACT、Diffusion Policy 和基于檢索的 VINN 。
表 1 為協同訓練提高 ACT 的結果。在協同訓練的幫助下,機器人擦酒成功率 95%、呼叫電梯成功率 95%、沖洗盤子成功率為 80% 等。
協同訓練提高了機器人在 7 項任務中 5 項的性能提升,分别提高了 45%、20%、80%、95% 和 80%。對于其餘兩項任務,協同訓練和不進行協同訓練的成功率相當。該研究發現協同訓練對于精确操作是瓶頸的子任務更有幫助,例如按下按鈕、翻轉蝦和打開水龍頭。
在表 2 報告了 Mobile ALOHA 在 2 個現實任務(擦酒和推椅)上的協同訓練和無協同訓練的成功率。
更多詳細技術細節,請參閱原文。