天天看點

剛剛,一位機器人戴着畢業帽走出清華

作者:量子位

衡宇 發自 凹非寺

量子位 | 公衆号 QbitAI

這年頭,人形機器人都有清華的學士帽戴!

這位走出清華二校門的機器人,簡直要把門口參加暑期研習營的小孩們饞哭了。

剛剛,一位機器人戴着畢業帽走出清華

不僅擁有清華紫學士帽,在剛剛結束的WAIC“具身通用人工智能”論壇上,這個名叫小星的人形機器人,還和圖靈獎得主、中國科學院院士姚期智合影貼貼。

是誰羨慕了?我不說。

剛剛,一位機器人戴着畢業帽走出清華

小星這“人”,出自清華大學交叉資訊研究院(IIIS)陳建宇團隊,整機結構、電機、減速器、驅動器、步态算法等機器人軟硬體将通通自研。

陳建宇,31歲的清華叉院助理教授,28歲時,就已經以叉院博導的身份走在從教之路上。

剛剛,一位機器人戴着畢業帽走出清華

博士畢業于UC伯克利,大學就讀于清華大學精密儀器系,研究領域包括機器人學、強化學習、自動駕駛等。

人形機器人小星

一起來認識一下,這位青年博導“教”出來的人形機器人——

體重28kg,身高1.2m,加上雙手後,全身上下具有34個自由度。

在行走方面,小星在不同類型的地面上都可以穩步前進,比如落滿枯葉的林間小道:

剛剛,一位機器人戴着畢業帽走出清華

或者是公園花壇旁的水泥上坡路:

剛剛,一位機器人戴着畢業帽走出清華

腳下的地皮換成草坪,也不妨礙它踏步前進:

剛剛,一位機器人戴着畢業帽走出清華

總之就走得還挺穩的,速度也還不錯。

與此同時,它還能利用雙手提供一些服務功能,遞個燒烤、端杯咖啡什麼的:

剛剛,一位機器人戴着畢業帽走出清華
剛剛,一位機器人戴着畢業帽走出清華

在液壓驅動和電機驅動二者之間,小星采用了成本優勢更高的後者。

為了研發高性能、低成本的人形機器人,團隊堅持最新一代的準直驅力控方案,用高扭矩密度電機搭配低減速比減速器,用電流環直接力控搭配動态雙足行走算法。

這種方案對電機扭矩要求極高,是以團隊也一直在探究新的電機設計方案。

目前所研制的電機扭矩密度已達到了30Nm/kg,是TQ電機(目前工業界最強)的兩倍以上。

如此一來,無論是行走還是擺臂動作,小星都能保持在一個比較靈活的狀态。

量子位,贊254

不過,陳建宇也坦然表示,目前小星機器人硬體上搭載的算法智能性還不夠高,小星的現階段表現,還沒有發揮硬體可以支援的極限。

是以,團隊的另一項主要工作就是推進前沿的機器人智能算法,目前走的是動力學模型+優化控制和實體仿真+強化學習這兩條機器人領域最前沿的路徑。

相比于傳統的機器人算法,二者都更為通用,并且可以更多地利用動力學來提高性能。

這兩大方法也是陳建宇博士期間的主攻研究方向。

2017年,陳建宇提出了一系列實時軌迹優化算法并成功應用于無人車上。

從2018年起,陳建宇的研究重點轉向了更為前瞻的方法——深度強化學習算法。在這一階段,他做出了領域内較早的幾個基于自學習方法的複雜道路環境自動駕駛工作。

“從數學上來說,無人車也是一類機器人,我們研究的算法對于無人車和機器人來說都是通用的。” 陳建宇表示,在無人車時期關于強化學習的經驗,不少都可以遷移到人形機器人的研究上,“當然,無人車和人形機器人的關注點不全相同,比如無人車在底層控制方面相對簡單,而對上層的決策規劃和互動等關注較多”。

通過強化學習結合人體運動資料,小星在高精度實體仿真中學會了高度拟人的步态行走:

剛剛,一位機器人戴着畢業帽走出清華

還能挖掘出硬體的極限性能,達到4m/s的奔跑速度:

剛剛,一位機器人戴着畢業帽走出清華

除了靈活的雙腿,小星的雙手也很靈巧。

通過大規模并行仿真強化學習訓練,小星學會操控其二十多個自由度的雙臂靈巧手來完成各類任務。

剛剛,一位機器人戴着畢業帽走出清華

此外,為了協調小星手腳之間的協同工作,團隊還提出了一種分布式技能學習算法。

剛剛,一位機器人戴着畢業帽走出清華
剛剛,一位機器人戴着畢業帽走出清華

“我想,人形機器人是所有機器人學家的夢想!”從大學起,陳建宇就開始關注雙足步态算法,他的大學畢業設計,做的就是雙足機器人落腳點規劃。

2020年畢業回國,在探索過無人車、機械臂、機器狗後,于2021年底開始構思籌劃研發自己的人形機器人。

籌備了半年,想通了技術路徑,也就是去年春夏之交,陳建宇開啟了自己的新目标:

打造人形通用機器人,以及搭載在上面的“通用智能”。

具身通用人工智能

目前人形機器人存在的技術難題是什麼?陳建宇總結了最受關注的三個方面:

首先,由于人形機器人具備高度內建性和複雜性,硬體本體建構具有較高挑戰性;

其次是運動小腦的建構,如何控制雙腿行走和操控雙臂完成各種任務,還未被很好解決;

最後是人形機器人的“大腦”,如何将目前隻有語言功能的大模型拓展到實體世界,并讓其進行行為決策,是實作具身通用智能體至關重要的一環。

——這就引出近期最火的技術話題之一,具身智能。

5月的ITF World 2023半導體大會上,黃仁勳在演講中明确表态,下一波AI浪潮就是具身智能(Embodied Intelligence)。

剛剛,一位機器人戴着畢業帽走出清華

所謂具身智能,就是能夠了解、推理并與實體世界互動的智能系統,可以了解為有身體,并支援實體互動的AI智能體。

而具身智能的終極目标,就是具身通用人工智能。以ChatGPT為代表的通用人工智能雖然帶來了極大的轟動,但其隻有語言與文本處理的能力。未來我們一定需要更加有用的具身的通用人工智能。

7月WAIC的具身通用人工智能論壇,邀請了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu等國内外知名大咖學者一起探讨具身AGI的未來,内容涵蓋決策控制、感覺認知、本體建構、算力支援、大模型理論等。

小星也在論壇上進行了現場首秀,獲得了大量關注。

剛剛,一位機器人戴着畢業帽走出清華

國際上,一些團隊已在這個方向上有了初步的成果:

今年年初,谷歌推出5620億參數的多模态具身視覺語言模型PaLM-E,可以執行各種複雜的機器人指令而無需重新訓練。

哪怕受到幹擾,也能完成“幫忙從抽屜裡拿薯片”的指令。

李飛飛團隊也新近釋出了具身智能最新成果,大模型接入機器人,把複雜指令轉化成具體行動規劃,無需額外資料和訓練。

人類可以很随意地用自然語言給機器人下達指令,如“打開上面的抽屜,小心花瓶!”

剛剛,一位機器人戴着畢業帽走出清華

陳建宇團隊也在推進這方面的研究工作。

并且做出了世界上第一篇大模型結合人形機器人的學術工作。

剛剛,一位機器人戴着畢業帽走出清華

他們用大模型來指導小星的上層任務規劃,用強化學習來擷取小星的底層控制器。

與此同時,還提出了一套新的架構來解決上層規劃和下層執行之間的對齊問題,以確定下層控制能很好地執行上層規劃的任務。

剛剛,一位機器人戴着畢業帽走出清華

“我們發現,一些簡單的操作場景,接入13B的開源模型就比較夠用了。”陳建宇分享了實驗過程中的發現,“作為定位家庭服務的機器人,對數理邏輯、推演等功能的要求并不太高。”

緊接着,量子位又把“大模型幻覺在具身智能身上的解決思路”這個問題抛給了陳建宇。

比起網絡世界裡的胡說八道,現實世界人形機器人受到帶有幻覺的指令,似乎是一件更為嚴肅、需要正視的事情。

思考片刻後,陳建宇給出了他的答案,那就是可能需要兩手解決方案,一方面是大模型産品本身對幻覺的控制,另一方面,在底層的控制也要加強。

之前我在研究無人車對安全性的要求時,會設計一些方案提升無人車的行為安全,具身智能也可以采取相同的思路,在機器人收到“不安全”的指令時,及時識别,更改到安全區域範圍。

是以,添加一個完全基于實體規律,類似于安全護盾的底層保護層,或許是不錯的辦法~

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态