李飛飛新成果！機器人接入大模型，0訓練就能完成複雜指令...

作者：寫下來 2023-07-11 18:00:00

李飛飛團隊最新成果。

李飛飛團隊的具身智能研究取得了新進展。他們成功地将大模型內建到機器人中，無需額外的資料或訓練，便可使用自然語言向機器人下達指令。例如，“打開上面的抽屜，小心花瓶”。大語言模型和視覺語言模型結合起來，可以從3D空間中分析目标和障礙，并幫助機器人進行行動規劃。

在真實世界中，機器人在沒有接受教育訓練的情況下也能直接執行這個任務，并可以操作任何物體，無需事先劃定範圍。例如，打開瓶子、按下開關或拔下充電線。目前，該項目的首頁和論文已經上線，代碼即将釋出。學術界對此也非常感興趣，已經引起了廣泛的讨論。一位前微軟研究員評價說，這項研究走在了人工智能系統最重要和最複雜的前沿。

如何讓機器人直接聽懂人話？李飛飛團隊将這個系統命名為Vox Poser。其原理非常簡單。首先，需要輸入環境資訊和要執行的自然語言指令。然後，LLM大語言模型會根據内容編寫代碼。生成的代碼将與VLM視覺語言模型互動，以指導系統生成相應的操作訓示。Vox Poser使用的地圖是3DValue Map。

生成的3D地圖将作為動作規劃器的目标函數，并合成最終要執行的操作軌迹。這直接解決了機器人訓練資料稀缺的問題。軌迹合成時，通過緩存輸出使用閉環視覺回報，并在遇到幹擾時快速重新規劃。是以，Vox Poser具有很強的抗幹擾能力。

大約一年前，李飛飛在美國文理學會會刊上發表了一篇文章，指出計算機視覺的發展方向有三個：具身智能、視覺推理和場景了解。機器執行任務需要視覺推理、了解場景中的三維關系，以及了解場景中的人，包括人類意圖和社會關系。将大模型與機器人結合起來，正是解決這些問題的一種方法。

李飛飛新成果！機器人接入大模型，0訓練就能完成複雜指令...

繼續閱讀

2023年醫學人工智能領域九大前沿成果釋出！

猜猜李飛怎麼瘦的：生物黑科技還是饑餓遊戲現場版？

殲-15“飛鲨”是中國航空工業在自主研發道路上取得一項重要成果

李飛怎麼瘦成這樣了？網友：這還是我認識的小老頭嗎？

中關村論壇開幕！十項重大科技成果釋出，涉腦機接口、晶片等

OpenAI或将推搜尋引擎，挑戰谷歌；李飛飛AI公司獲融資，主打「空間智能」；嫦娥六号發射成功，開啟月球之旅

AGI要聞：斯坦福李飛飛首次創業，瞄準“空間智能”；OpenAI下周釋出搜尋産品挑戰谷歌｜钛媒體AGI

2024 AUA中國之聲 | 國研新藥創新成果持續湧現，再登國際學術舞台

農林下路國小舉行2024校園紅領巾勞動成果愛心義賣活動

李飛飛被曝AI創業！做空間智能，已籌集種子輪融資

聽考古人講考古讓公衆樂享考古成果

AI教母李飛飛首次創業！成立“空間智能”公司，已完成種子輪

AI教母李飛飛創辦空間智能公司，力圖克服大模型AI技術的現有局限

李飛飛創業了！公司方向是“空間智能”

“AI教母”李飛飛創辦空間智能公司，力圖克服大模型等AI技術的現有局限

李飛飛最新報告：美去年AI領域私人投資是中國近9倍，中國仍是