天天看點

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

作者:新智元

編輯:編輯部

【新智元導讀】大模型這把火點燃了整個機器人行業的熱情。縱觀全世界,過去幾個月,國内外大模型大廠和機器人初創公司的合作也是動作不斷。看來,機器人的元年真的來了!

大模型,已然卷入機器人領域。

3月初,初創公司Figure釋出了首個由OpenAI大模型加持的人形機器人Figure 01的示範。

憑借LLM「大腦」,Figure 01可以看到桌面上的蘋果,動手收拾餐具,并與人類進行無縫交流。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

在電動Atlas官宣當天,初創公司Mentee Robotics也展示了首個Menteebot人形機器人,通過自然語言即可交流。

同樣,得到大模型加持的Menteebot,能解釋指令,并思考、決策、完成任務。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

在大模型浪潮下,類似的案例近一年來層出不窮。

反觀國内,大模型助推下,機器人領域也是熱度不減。

年初,具有「人形機器人第一股」之稱的優必選股價創下2天3倍的暴漲走勢,與之呼應的是大模型廠商近期與機器人行業的合作也是動作不斷。

有行業專家表示,具備多模态LLM大腦的機器人時代終于來臨了。這些機器人将能夠了解指令并執行任務:可以使用筆記本、刷碗、沖泡咖啡,妥妥的AGI!

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

顯然,大模型賦能機器人蘊藏着巨大的潛力,成為科技大廠為數不多的一個共識。

「具身智能」大爆發,元年已來

人們都說,2024年是機器人的元年。

大模型的橫空出世,無疑讓機器人行業再次成為研究界和産業界的一大亮點。

先來看一張圖,直覺地感受下,目前全世界取得進展的機器人公司。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

正如許多人期待的那樣,AGI真正到來的那天,「具身智能」正是不可或缺的重要硬體載體。

從過去一年至今,機器人領域的投資市場不斷持續升溫,迎來了高光時刻。

研究公司Robot Report資料顯示,今年前3個月,機器人初創公司籌集了32億美元資金,去年同期為17億美元。

在國外,OpenAI押注的兩家人形機器人初創公司1X、Figure紛紛得到新一輪的融資。

還有矽谷服務機器人Bear Robotics、專為機器人開發大腦Physical Intelligence、還未創收的Skild等機器人初創公司,同樣受到資本的追捧。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

國内以優必選為代表,2023年12月底上市即成為人形機器人第一股;如前所述,股票一路攀升。

不久前,工業版人形機器人Walker S都已經進入工廠中的房間開始打工了。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

此外,宇樹人形機器人在今年2月完成了近10億元的B2輪融資,其産品宇樹H1更是火到了國外。

根據網友的統計,僅在今年第一季度,國内機器人市場就有20多起融資案例。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

來源:網絡

可見,大量資本的注入,将機器人行業的熱潮推向了最高點。

實際上,對于每個人來說,機器人早已不是什麼新鮮事物。

為什麼大模型的加入,讓其迎來了ChatGPT時刻?

為什麼需要多模态LLM

衆所周知,傳統機器人有着一個明顯的局限性——需要明确的指令。

掌握單個技能,諸如開門、拉抽屜、拾取和操縱某物,對于它們來說,并不難。

然而,想要讓機器人去完成多個技能結合的任務,是非常困難的。

這就是為什麼大模型的出現,破解了傳統機器人需要明确指令,才能執行任務的僵化問題。

簡單來說,LLM可以将松散定義的指令,映射到機器人技能範圍内的特定任務序列。

比如,當你對機器人點頭時,如何讓它也能友好地向你點頭?

來自多倫多大學、谷歌DeepMind等機構開發的GenEM,利用GPT-4豐富的知識儲備,将「點頭」這一抽象行為,轉化為機器人可輸出的特定動作。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

然而,通往具身智能AGI的路上,僅依靠大語言模型是不夠的。

這是因為,圖像、文字、語音、視訊等各種多模态資訊,構成了我們的現實世界。而人類的感受、溝通,都是在以多模态形式進行。

對于智能機器人來說,也是必須具備的能力。

比如,當機器人想要正确執行「有點累,幫我去拿一杯提神的飲品」這條指令時,最關鍵是完成「多模了解」。

看到桌面上的一堆食物,哪個才是咖啡呢?

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

在了解語音指令、拆解任務步驟之後,機器人需要識别「視線」裡的物體,判斷推理出哪瓶飲料是符合指令意思需要拿取的。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

不僅如此,嗅覺、味覺之類的智能,也将是機器人未來逐漸擴充的領域。

總而言之,多模态能力對于真正要進入家庭的機器人來說必不可少,尤其是多模了解尤為重要。

國産頂流:訊飛星火大模型

看得出,市場對機器人的熱情,已完全被AI大模型點燃。

國内一家成立25年的公司,曾在2022年就啟動了「超腦2030計劃」,暢想着能夠讓機器人走進每個家庭。

這一計劃共分為三個階段,通過逐漸推進,讓AI可以懂知識、善學習、能進化。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

一直以來,基于對前沿技術的不斷探索,背後這家公司——科大訊飛正朝着目标前進。

先是在2022年科大訊飛全球1024開發者大會上,首次釋出了「訊飛機器人超腦平台」。

這一平台面向開發者,提供了全棧的工具鍊,包括模型訓練、資産生成和軟硬體接入等等。

ChatGPT引爆大模型熱潮之後,科大訊飛在23年5月首次釋出「訊飛星火大模型」,并在一年多的時間完成了5次疊代。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

而初代訊飛星火大模型就具備了展現通用人工智能的七大次元,包括文本生成、語言了解、知識問答、邏輯推理、數學能力、代碼能力以及多模态能力。

在接下來的6月、8月、和10月以及今年1月,訊飛星火大模型完成了從V1.5、V2.0,到V3.0、V3.5的疊代更新。

大模型打破傳統認知智能的天花闆,為機器人更加深入地了解世界奠定了堅實的基礎。

然而,要充分整合這些先進技術,以促進機器人在人機互動、任務規劃和環境适應等方面的顯著進步,還需要依賴專門的系統。

為「機器人超腦平台」注入靈魂

為此,科大訊飛在2023年7月正式将訊飛星火大模型與「機器人超腦平台」進行了深度的融合。

具體來說,科大訊飛機器人超腦平台,是以訊飛超腦2030技術為底座打造的,一個面向實體世界、虛拟世界和元宇宙的機器人開發平台。

它以多模态感覺表達、開放式語義了解、大小腦協同運動控制和軟硬體接入為核心,可以幫開發者快速搭建實體機器人和虛拟數字人産品。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

如今,人形機器人在實際應用時,面臨的挑戰更多了。

你是不是經常在商場遇到機器人,雞同鴨講,根本講不了兩句話,就被逼瘋了?

在這樣的嘈雜環境中,人與機器人的互動,簡直難上加難。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

又或是,當你讓機器人講一個笑話時,那一本正經的播音腔,簡直就是尴尬氛圍組上線。

而破解這些問題的關鍵是,讓機器人更好地「拾音」,且說話不再有那麼重的「機器味兒」。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

訊飛機器人超腦平台從「視聽融合的多模态感覺互動」和「大模型了解決策」兩個方面,解決了這一難題。

首先,就是打造機器人互動的新範式。

為此,訊飛機器人超腦平台融合了語音、視覺、語義等多個次元的資訊。

通過更新麥克風陣列算法,融合聲音、人臉、和唇形資訊,即使在嘈雜、高噪的場景下,機器人都能精準拾音,實作複雜場景「聽得清」。

同時,通過語音大模型和超拟人合成技術,機器人「聽得準」,「答得自然」,讓機器人聊起天來更有生命力和感染力了!

其次,就是機器人的互動大腦。

這個大腦,毫無疑問就是基于訊飛星火大模型,實作了控制級指令、官方技能、核心業務功能、快速知識問答、閑聊陪伴等多互動場景的統一。

對于每個孩子來說,如果機器人能以媽媽的聲音、口吻講睡前故事,才堪稱真正的「陪伴」機器人。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

但若要實作這一點,還需要機器人具備情感化和高表現力的合成能力。

對此,訊飛機器人超腦平台還設計了多風格、多情感的AI人設,能夠讓每個機器人都與衆不同。

順便提一句,訊飛機器人超腦平台的虛拟人驅動協定已全面開放。

三方數字人産品通過接入該驅動協定,可以實作與訊飛數字人同等的互動效果。

訊飛機器人超腦平台已賦能四大領域398家機器人客戶,深度連結1.3萬名機器人開發者。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

官網位址:https://aibot.xfyun.cn

星火加持,機器人飛升

為了進一步擴大合作生态,2024年4月15日,科大訊飛正式啟動「星河行動」計劃,招募生态合作夥伴共同推進機器人産業的繁榮。

而在此之前,有很多來自不同細分領域的國内頭部機器人廠商,就已經用上了科大訊飛星火大模型的強大能力。

目前,在許多人看來,人形機器人是最好的通用具身形态。

當機器人走向落地,人形并不一定是完成任務最好的形态。它可以是一個機械臂,也可以是輪式......

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

科大訊飛與穿山甲機器人公司合作已久,一直共同探索AI技術與機器人的融合,不斷拓寬服務機器人應用新的邊界。

這家公司旗下新款小魚、艾米、小雪等AI服務機器人,全都搭載了訊飛機器人超腦平台,以及訊飛星火大模型技術。

基于訊飛先進的語音識别、AI技術,機器人可以流暢地進行自然語言對話,迅速了解并給出準确回答。

同時,憑借着豐富的技術儲備,它們還能提供各類資訊和建議。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

穿山甲機器人已廣泛應用到餐飲、政務、教育、醫療等領域

當然還有家庭服務機器人,樂天派便是其中的代表之一。

通過接入訊飛星火大模型和多模态互動,這款桌面黑科技機器人成為孩子們的貼心「小管家」。

隻需要一聲呼喚,不論是娛樂、還是遇到學習生活難題,它都能以前所未有互動能力陪伴孩子。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

而在頭部人形機器人中,也少不了科大訊飛核心技術的身影。

我們熟知的,智元機器人、優必選、宇樹科技等公司,都得到了訊飛全鍊路語音,以及訊飛星火大模型的加持。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

還有近日官宣合作的EX機器人,更是将雙方各自優勢完美結合。

基于訊飛機器人超腦平台,将訊飛星火大模型和多模态互動技術應用到EX仿生機器人中,實作了與人一樣的思考、對話和動作。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

除以上的案例之外,科大訊飛生态「朋友圈」還在不斷擴大。

機器人開發,最好的時代

我們還應該看到,機器人的發展不僅依靠AI大腦的技術疊代,還需要「身體」并行。

随着機器人行業的逐漸發展,機器人行業内的元件供應也開始向專業化、成熟化方向發展。

4月2日,在上海召開的中國人形機器人生态大會上,可以看到機器人部件廠商也獲得了長足的發展——

人形機器人通用底座、機器狗通用底座、機器人超腦闆、多模态語音互動、3D視覺晶片、靈活機械手、機器人伺服電機、3D列印架構等廠商均參加展出。

會場進行了多項專題報告,比如「多模态+大模型,建構人形機器人新互動」、「人形機器人感覺技術與發展」等細分領域的成果展示。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

對于機器人行業的創業者和開發者來說,這将是最好的時代!

大量子產品化、可快速整合的行業平台及部件,讓機器人的開發不再需要像過去一樣,從0開始做算法。

尤其是,像訊飛機器人超腦平台已經引入大模型的通用開放平台,進一步将機器人的正常算法和人機互動開發難度降低到了「拿來即用」的地步。

再加上,訊飛機器人超腦平台已經打通了對接鍊路公司(宇樹、智元、EX機器人等)的成熟機器人硬體體系。

這意味着,二次應用開發将會成為入行最快、産品最快滿足客戶需求的方式之一。

顯然,機器人底層硬體配套已初步具備,LLM技術更是賦予了機器人互動的核心。

接下來,針對客戶需求的挖掘、痛點解決方案和使用者貼身服務的内容,尚需進一步打磨。

這,将是機器人行業萬衆創業的開端。

大模型+機器人,前景一片大好

下一步,就是在LLM和機器人加速融合後,如何推動商業化落地?

從認知能力上來看,AI機器人的發展愈加接近人類。甚至,在外表方面,也變得更像人類了。

波士頓咨詢公司(BCG)估計,到2030年,全球機器人市場規模将達到1600億美元-2600億美元。

也就說,LLM+機器人未來的市場前景非常廣闊,可以深入應用于各種工業領域和人類生活場景。

在制造業領域,裝配線上的機器人能夠生産出,人類勞工無法比拟的高品質和一緻性的商品。

在倉庫和物流公司中,AI機器人能夠完成重型搬運工作,諸如運送産品、放置在貨架等任務,大大減輕了人類勞動力的負擔。

就比如,亞馬遜物流倉庫中的75萬機器人大軍,已全面投入了使用。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

除了工業領域的機器人,AI醫療機器人還可以幫助醫生做手術,做出更準确的診斷,也能引導患者完成實體治療和康複。

展望未來,在餐館、太空探索、教育、養老院等諸多場景中,都将得到AI機器人的全面覆寫。

不難料到,機器人的曙光已經到來,它正在以我們幾十年前隻能想象的方式重塑整個世界。

科大訊飛所做的,就是用技術革新,讓機器人走進每個家庭。

國産大模型卷翻機器人!這些火遍全網的機器人,都裝上了星火大腦

繼續閱讀