作者|楊逍
編輯|鄧詠儀
2023年以來,機器人領域的創業紛連不斷。部分公司選擇從人形機器人出發,希望創造出能獨立行走、完成部分複雜工作的通用形态;也有部分公司的研究側重于突破機器人全腦模型,希望賦能機器人,讓其具備接受人類指令并規劃拆解任務的通用決策能力。
千訣科技是一家專注于機器人大模型研發的創業公司,希望研究出适配不同機器人裝置形态的通用機器人大模型。
在産品思路上,千訣科技的機器人大模型分為感覺、決策、控制三個部分。近期,千訣科技的感覺模型“千訣·丘腦”取得了較大産品突破。
丘腦是一個多功能的腦區,用于将動物的多模态感官資訊進行提取,傳輸至大腦皮層。丘腦的作用遠超過一個簡單的資訊傳遞站,它除了收發感官資訊以外,還要對其進行一定的處理,包括壓縮、解析以及調節生理信号等,對生物體智能的發揮起着至關重要的作用。
多模态疊代的丘腦思維鍊
相比于眼睛等各類基礎感官,丘腦的突出功能在于其有一定的思維能力。千訣科技推出了“千訣·丘腦”大模型,希望賦予通用機器人以感覺世間萬物的能力。使用小型化語言模型作為丘腦的中央處理器,通過建構多模态互相疊代的思維鍊,實作對物體狀态屬性由粗到細的感覺。
物體操作屬性感覺
據千訣科技創始人兼CEO高海川介紹,相比于傳統檢測和圖文比對等計算機視覺工作,機器人“丘腦”具有一定的思維能力,在感覺過程中就快速完成對所攝入的環境資訊的非結構化思維;相比于機器人決策大腦,丘腦的思維又具有快速性的特征。
而在呈現出來的效果上,千訣·丘腦已支援識别物體與機器人操作相關的大部分屬性。它支援中文輸入輸出,會自動回報上述屬性,包括檢測定位以及豐富的狀态資訊。
在感覺物體的顆粒度細節上,基于自動化的多模态思維鍊,千訣·丘腦可感覺物體的細粒度細節,例如瓶蓋、把手等。
物體一般性屬性識别
在感覺物體的類型上,千訣·丘腦可感覺物體的種類數已覆寫了衣食住行、日用百貨,還包含飛禽走獸、草木蟲魚。此外,它還展現出了一定的本土化色彩,能檢測出具有中國特色的食物等。
特色物體識别
高海川表示,它可以向大量訓練集以外的物體泛化,推演出千變萬化的物體種類,哪怕是對非常存在疑惑性表述的物體,也可以精準識别,包括用方言描述、網絡流行詞描述等,并可服務于機器人以外的諸多應用領域。
不同顆粒度物體識别
在千訣·丘腦加持下,團隊打造了一款自主決策服務機器人,支援辦公室環境通用任務的端到端拆解與執行。
未來,千訣科技會持續對丘腦進行更疊,朝着感覺物體更細微特征的方向發展,希望打造一個“其大無外、其小無内”的全屬性感覺器。
此外,千訣科技預計于2024年初釋出機器人決策模型——千訣·大腦,将感覺模型和決策模型關聯,提升産品的通用化與智能化,以賦能更多的機器人廠商,降低大模型應用門檻。
機器人大模型的一個訓練難點是缺少高品質的機器人資料集。經過近半年的發展,千訣科技在資料集規模、資料标注次元上都有所提升。公司形成了一套開發機器人大模型的流水作業線,能夠自動化的标注、開發、清洗、微調資料,進而快速的疊代模型。
在産品形态上,千訣科技提供API形式的大模型接口,也會和硬體公司合作,推出對應的腦塢産品。
在團隊背景上,千訣科技的創始團隊出自清華大學自動化系老牌實驗室,專注于AI和機器人領域的研發,對大模型訓練和機器人決策算法有較深了解。