天天看點

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

作者:钛媒體APP
能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

近期,一款名為Mobile ALOHA的機器人因其出色的烹饪和家務技能在網絡上迅速走紅。

視訊中的機器人外觀較為基礎,主要由兩隻機械臂、提供運算能力的主機以及底部移動平台構成。從整體上看,這款機器人尚處于初級階段,更像是一個粗糙的“原型機”。與我們在科幻作品中看到的“機器人管家”相比,它還有很大的提升空間。盡管如此,這款機器人的潛力卻不容小觑。

此前也有不少服務機器人展示過烹饪、攙扶、地面清潔等能力,為何說Mobile ALOHA的潛力很大呢?主要原因是它擁有便宜且開源這兩個特點。換句話說,隻要你花費32000美元(約23萬元)且動手與學習能力足夠強的話,就能自己在家複刻一台具備這些技能的機器人。

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

開發出Mobile ALOHA的斯坦福三人組

這個由斯坦福三人團隊研發的通用機器人Mobile ALOHA,可以通過模仿學習,執行各種複雜的任務。同時在操控層面,除了可以自主操作外,還可以支援全身遠端操控。

人類的“機器夢”何時才能圓?

從機器人發展的整體方向來看,可以被簡單劃分為專用機器人和通用機器人兩類,前者主要聚焦于提升單一場景的生産、幹活效率。在日常生活中,人們或多或少都會接觸到此類産品,像智能工廠裡應用的各類機械臂,家裡用于清潔地面的掃地機器人、酒店中用于派送物品的送貨機器人等,都可以劃分為專用機器人。

通用機器人與之相比則擁有更廣泛的适用性,尤其是在“為人提供服務”的層面,通用機器人的一大結構特點就是更具“拟人化”特征。因為它的最大用途就是代替使用者去完成一部分日常工作,像做家務、做飯等等,是以很多科技公司以及研究機構在産品設計之初,就會将“人形機器人”作為未來持續投入的發展方向。

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

WABOT-1

世界上第一個全尺寸人形“智能”機器人WABOT-1誕生于1972年,但早期的電機、驅動程式、算力都很難滿足機器人的應用需求,WABOT-1隻是一個形态上具備類人特征的産物。2009年,波士頓動力開始研發PETMAN人形機器人,此後又推出了不斷疊代的Atlas,在整個21世紀10年代,它就是受關注度最高的人形機器人産品。

2022年,随着特斯拉首次展示Optimus機器人,這台能走路、能揮手能舉重甚至可以組裝另一個“自己”的機器人再次重新整理了大衆對于人形機器人發展速度的認知。

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

CyberOne

除了國外企業,近兩年國内科技企業也在加速布局人形機器賽道,像蒂艾斯科技的exrobots、優必選釋出的WALKER X機器人、小米推出的CyberOne等等。但以上這些機器人都存在一個問題,就是它們隻屬于“未來”,特斯拉預計2030年才會将Optimus完成大規模量産并推向市場。

而Mobile ALOHA的出現,則開啟了普通人與機器人接觸的低門檻通道,斯坦福團隊除了在網頁中展示了Mobile ALOHA所能實作的能力以外,也完整開源了機器人的軟硬體所涉及到的各類參數、資料内容,比如機器人使用的硬體以及具體的參數資訊。

具備學習能力的“機器人保姆”

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

Mobile ALOHA配備有2個腕部攝像頭,和1個頂部攝像頭,并配有移動電源和本地計算子產品,在其自主執行時隻使用2個ViperX 300。兩隻手臂的最低/最高高度分别為65厘米/200厘米,并可以從底座向四周最長能夠伸出100厘米。

算力方面,從視訊中可以看到,Mobile ALOHA的“大腦”其實是一台筆記本電腦,根據官方公布的資料,其配置為英特爾第十二代酷睿處理器i7-12800H,顯示卡則采用了英偉達RTX3070ti,這套配置放在2024年的市場來看,意味着隻需要一台8000元左右的遊戲本,就能滿足Mobile ALOHA的算力需求。

為了讓機器人具備更大的活動範圍,研發團隊在組建Mobile ALOHA時選擇了将AgileX Tracer AGV(Tracer)作為了移動底座,這原本是一個專為倉庫物流設計的移動平台,其移動速度可以達到1.6m/s、最大有效載荷為100kg,由于全套資料均為開源,是以在組建過程中,其他人也可以根據自身需求對方案做進一步的DIY。

除了硬體以外,Mobile ALOHA還通過加入資料和視覺的學習能力,也就是當下比較流行的“大模型”人工智能。Mobile ALOHA的學習能力由兩部分組成,包括靜态ALOHA資料集以及基于視覺識别或手動操控獲得“模仿能力”。

能做飯會收拾,斯坦福一團隊僅用23萬元就造出了“機器人保姆” | 钛媒體焦點

目前已經開源的靜态ALOHA資料集總共有825個示範任務,包括密封袋子、拿起叉子、包裝糖果、撕紙巾、打開帶蓋塑膠杯、玩乒乓球、使用咖啡機、翻轉鉛筆、固定魔術貼電纜、裝上電池和操作螺絲刀等等。

示範中,研究人員每個任務隻用了50個示範就可以讓Mobile ALOHA機器人開始學會做這件事,比如連續9次擦拭灑在桌子上的葡萄酒,連續5次乘坐電梯。最終呈現的整體效果還是不錯的,Mobile ALOHA完成了從備菜烹饪到最後清掃收拾的所有環節。

钛媒體App注意到在烹饪環節,Mobile ALOHA除了可以執行切菜的固定動作以外,也學會了颠勺、擺盤等操作。在收拾的過程中,它既能夠挪動對椅子這樣體積較大且笨重的家具,同時也能夠對盤子這樣體積小且光滑的物品的抓握與清潔,說明作為通用機器人其場景應用空間還是很大的。

那麼對于整個機器人産業來說,Mobile ALOHA也有很大意義,首先是作為開源項目,自然會吸引到很多企業以它為基礎藍本開始探索類似機器人的商業落地能力,并且随着零部件從目前的單獨采購變為規模化供應,成品的成本将會進一步降低,進而推動機器人的普及化。

同時,Mobile ALOHA也指明了當機械元件不斷成熟後,依靠大模型人工智能為機器人賦予的學習能力,能夠讓機器人的應用潛力得到更快的釋放。

此前斯坦福大學機器人實驗室主任、計算機科學教授,IEEE會士,國際機器人研究基金會主席Oussama Khatib就曾表示:“機器人面臨新的環境和新的挑戰之一便是複雜的環境帶來的學習成本問題,如今機器人要面對的是從工廠當中走出來,進入到實際複雜的人類環境,是以它需要具備人類的智慧。”

而大模型人工智能與日漸成熟的機器人零部件供應體系,顯然讓“機器人走入普通家庭為大衆服務”的程序得到了加速。(本文首發钛媒體App,作者/鄧劍雲,編輯/鐘毅)

繼續閱讀