天天看點

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

報告出品方:西南證券

以下為報告原文節選

------

1AI賦能機器人,具身智能發展正當時

1.1機器人是AI落地的最佳載體

具身智能(EmbodiedIntelligence)是AI進入實體世界進行互動的載體。根據智能程度,可以将機器人分為兩類:非智能機器人和智能機器人;同時根據有無載體,也可以将人工智能分為兩類:虛拟AI和實體AI。機器人與人工智能的交集,即:作為AI實物載體的智能機器人。一般的工業機器人隻能被程式設計為執行重複的一系列運動,所有的運動軌迹、位置、動作、力度都需要提前設定,更突出其“機器”屬性,智能機器人則可以與外界互動,根據自身對外界的感覺,決定完成任務的方式,并且可以在失敗中不斷學習進步,相較于非智能機器人的“機器”屬性,智能機器人更像是“人”。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

AI機器人可以分成五大部分。1)感覺系統,相當于機器人的“五官”,包括聲音、光、溫度、壓力、定位、接觸等傳感器,用以将外部環境信号轉換為機器人可以了解的資訊或者資料;2)驅動系統,相當于機器人的“肌肉”,電機驅動包括電機、減速器、編碼器等;3)末端執行系統,相當于機器人的“手”,用以和外界環境進行互動;4)能源供應,電源或者電池;5)運算系統及軟體,相當于機器人的“大腦”。

AI機器人在完成任務時需要經曆三個層次。給到機器人一個任務時,機器人一般要經曆三層資訊處理:1)第一層是感覺,了解需求和環境。機器人通過傳感器感覺周圍環境,并且識别到任務體在環境内所處的位置。2)第二層是規劃,拆解成任務和路徑規劃,機器人了解任務之後,它需要将任務拆解成多個步驟,按順序執行步驟達到完成任務的目标。3)第三層是執行,驅動硬體執行任務,把運動規劃轉變成為機械指令,确定能量、動量、速度等參數,開始執行任務。非智能機器人無法對外界進行自主感覺,需要人類計算出運動路徑并設定運動參數,而智能機器人可以自主感覺外界,并拆解任務、設計路徑,最終完成任務。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

人形機器人賽道迎來快速發展階段。進入到21世紀以來,以本田、波士頓動力為首的各大廠商紛紛布局人形機器人産品,但是受限于硬體和軟體的成熟度,早期的人形機器人發展緩慢。在算法和硬體的不斷進步中,人形機器人賽道也出現了很多“新面孔”,2022年以來特斯拉、小米等各大廠商陸續推出了自己的人形機器人産品,尤其特斯拉以“量産”為目标,預計将推動整個行業迎來快速發展。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇
機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

1.2AI大模型助力具身智能發展

各大科技巨頭紛紛推出AI大模型,有望解決人形機器人的通用性問題。1950年圖靈首次提出具身智能的概念,此後幾十年裡,受制于落後的AI技術,具身智能并沒有取得很大的進展。近年來随着硬體和軟體算力的不斷提升,各大公司相繼推出AI大模型算法,包括Open A I的GP T-4、谷歌的RT-1、PaLM-E等,有望解決機器人的通用性問題,具身智能迎來快速發展。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2022年12月,谷歌釋出多任務模型RoboticsTransformer1(RT-1),用以大幅推進機器人總結、歸納、推理的能力。RT-1是一種多任務模型,可以标記機器人輸入和輸出動作以在運作時實作高效推理。訓練模型使用的資料集涵蓋700多項任務的13萬個資料帶點,使用13台機器人在17個月内收集而成。RT-1可以顯著改進機器人對新任務、環境和對象的零樣本泛化,機器人執行從未做過的任務的成功率明顯上升,對不同環境甚至有幹擾的情況下的成功率也有上升;此外使用别的機器人資料來訓練模型,使得自己機器人的執行任務的準确率得到提升。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2023年3月,谷歌和柏林工業大學共同釋出可以用于機器人的多模态視覺語言模型PaLM-E,用視覺資料來增強其語言處理能力,可以指導機器人完成複雜的任務。PaLM-E主要基于谷歌現有的PaLM大語言模型,并且加入了感覺資訊的能力,能讓機器人真正“了解”任務,将看到的圖像轉化成可以了解的語言文本,進而做到在面對零樣本新任務時的“舉一反三”。PaLM-E無需對相關資料進行預處理或注釋。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2023年4月,Meta釋出了圖像分割模型SAM。SAM可以在不需要額外訓練的情況下對不熟悉的對象和圖像進行零樣本泛化,進而“剪切”任何圖像中的任何對象。在SAM釋出之前,想把圖像準确分割,需要人類手動分割後再交給機器人學習,這需要大量專家進行高度專業化的工作,費時費力。SAM使得機器人将所學到的分割圖像進行細緻标注,讓機器人了解對象(Object)是什麼,是以可以為任何圖像或視訊中的任何對象生成遮罩,即使是在訓練中沒有見過的對象。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2特斯拉人形機器人Optimus的AI賦能分析

2.1軟硬體不斷疊代更新,核心為優化成本和效率

特斯拉人形機器人Optimus問世,核心為優化成本和效率。2021年8月,馬斯克首次釋出特斯拉人形機器人(Tesla Bot)計劃,代号“擎天柱”(Optimus)。在2022年9月底舉辦的特斯拉AI DAY上,馬斯克公開了人形機器人Optimus原型機,人形機器人體重73kg,靜坐100W功耗,快走500W功耗,全身自由度200+,手部自由度27,搭載與特斯拉車輛相同的完全自動駕駛(FSD)大腦,2.3KWh電池組(內建充電管理、傳感器、冷卻系統)可以滿足一天的工作需要。特斯拉人形機器人的核心為在滿足功能的前提下降低成本和能耗,即盡可能減少零部件數量和每個元件的功耗,例如減少四肢的感應和線路。馬斯克稱特斯拉機器人有望在3-5年時間内傳遞,産量可以達到數百萬台,價格可能不到2萬美元。

人形機器人Optimus軟硬體不斷疊代更新。2023年5月特斯拉股東大會釋出人形機器人Optimus最近進展,包括機器人走路、利用視覺感覺周圍的環境、手臂精确控制力道不打碎雞蛋、手掌抓取線束等柔性物體、人類示範訓練AI、機器人修理機器人等場景,表明人形機器人Optimus的硬體和軟體性能得到進一步提升。

特斯拉人形機器人Optimus類似“汽車立起來裝上腳”,是以可以複用大量汽車相關技術進行疊代更新:

1)感覺系統:可采用和汽車類似的計算機視覺技術。根據最新的特斯拉股東大會,Optimus攝像頭方案為7個攝像頭配置(前方3個,兩側各1個,下方各1個),通過不同方向上的攝像頭觀察到的點來确定位置,投射到向量空間,讓機器人感覺、識别并且了解周圍環境。

2)驅動系統:14個旋轉線性執行器+14個線性執行器;

3)末端執行系統:“靈巧手”共12個空心杯關節;

4)能源供應:2.3KWh電池組(內建充電管理、傳感器、冷卻系統);

5)運算系統及軟體:搭載與特斯拉車輛相同的完全自動駕駛(FSD)大腦,将FSD使用到的神經網絡和模拟仿真訓練技術遷移到機器人,唯一需要改變是訓練資料集,通過處理視覺資料,做出決策,包括路徑規劃、路徑記憶、環境互動、導航充電等。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2.2 AI多次模拟,優化設計方案

車輛碰撞模型技術橫向遷移,保護機器人的“大腦”。2022年9月,在特斯拉AIDay上,技術人員展示了如何借助現有的AI碰撞模型對人形機器人部件排布進行優化。車輛碰撞模型會先記錄一次實體碰撞時各個傳感器的資料,然後将車輛資料和碰撞資料傳入系統中,生成一份資料庫,再由AI将車輛拆分成超過3500個自由度,模拟上萬次不同角度、力度的碰撞,最後将所有碰撞資料彙總,找到車輛現有構型的缺點并加以改進。工程師将此技術用于機器人部件排布設計,将重要部件放置在遠離碰撞受損核心處,并将外殼設計成更能抵抗外力的形狀,保證機器人即使意外摔倒也不會影響到軀幹内的核心零部件。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

AI仿真模型尋找成本和效率的最佳組合。人類有超過200個自由度,手部27個自由度,同時快走功耗隻有500W,低功耗的同時又具有高度的靈活性。在設計機器人時,需要機器人在完成具體任務的情況下,盡可能降低成本,在運動能力和低成本間找到最佳平衡點。特斯拉為機器人設計了全身28個執行器(不含手部),用以完成Pitch(繞X軸旋轉)、Yaw(繞Z軸旋轉)和Roll(繞Y軸旋轉)等不同動作,再通過AI仿真模型和實際驗證,在低功耗、低成本和最輕品質的目标下,選取一個關節的最佳設計。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

提高零部件通用程度,将28個關節簡化為6種執行器。特斯拉工程師使用多個場景模拟機器人的工作狀态,計算出每種場景下執行器的消耗和品質,并将其抽象為一個點,求解整個質點雲的帕累托最優,得到可以滿足多種使用場景的關節設計。經過AI的分析優化,将關節選型做到複用,最終實際的執行器減少到6種,包含3種規格的旋轉執行器和3種規格的線性執行器。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

2.3FSD+Dojo加持,提高機器人執行力

FSD技術助力機器人感覺世界。FSD算法是指特斯拉的全自動駕駛(FullSelf-Dri vi ng)系統采用的算法,用以實作車輛自主導航和自動駕駛功能,讓車輛能夠在各種交通環境下進行感覺、決策和控制。FSD算法主要依賴神經網絡和計算機視覺技術,通過處理和分析傳感器擷取的實時資料,提取有關道路、車輛、行人和障礙物的資訊,實作環境識别功能。目前特斯拉已經打通FSD和機器人的底層子產品,将FSD技術複用至機器人,在機器人感覺、決策、控制方面起到重要作用。

機器人行業報告:AI賦能人形機器人,關注核心零部件發展機遇

占據網絡讓機器人“擦亮”雙眼。在感覺層面,FSD使用占據網絡(OccupancyNetwork)對3D空間内的障礙物進行持續檢測,來估計障礙物的位置、大小、運動情況。FSD算法可以幫助機器人感覺周圍環境,識别物體、人和障礙物。

--- 報告摘錄結束 更多内容請閱讀報告原文 ---

報告合集專題一覽 X 由【報告派】定期整理更新

(特别說明:本文來源于公開資料,摘錄内容僅供參考,不構成任何投資建議,如需使用請參閱報告原文。)

精選報告來源:報告派

科技 / 電子 / 半導體 /

人工智能 | Ai産業 | Ai晶片 | 智能家居 | 智能音箱 | 智能語音 | 智能家電 | 智能照明 | 智能馬桶 | 智能終端 | 智能門鎖 | 智能手機 | 可穿戴裝置 |半導體 | 晶片産業 | 第三代半導體 | 藍牙 | 晶圓 | 功率半導體 | 5G | GA射頻 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圓 | 封裝封測 | 顯示器 | LED | OLED | LED封裝 | LED晶片 | LED照明 | 柔性折疊屏 | 電子元器件 | 光電子 | 消費電子 | 電子FPC | 電路闆 | 內建電路 | 元宇宙 | 區塊鍊 | NFT數字藏品 | 虛拟貨币 | 比特币 | 數字貨币 | 資産管理 | 保險行業 | 保險科技 | 财産保險 | 機器人行業