天天看點

“商湯日日新”大模型體系全面更新,為《三體》打造沉浸式科幻空間

作者:上觀新聞

昨天舉行的2023世界人工智能大會“大愛無疆·日日新”人工智能論壇上,記者獲悉,“商湯日日新SenseNova”大模型體系已完成多方位更新,正在金融、醫療、汽車等行業落地應用。商湯科技董事長兼CEO徐立表示:公司希望通過“大模型+大裝置”持續推動AI基礎設施能力的提升,建構更懂行業、更具專長的專業大模型,讓大模型的産業價值在千行百業中綻放。

在“大模型+大裝置”的AGI(通用人工智能)戰略布局下,商湯大模型體系正在高速疊代。作為千億級參數的自然語言處理模型,“商量SenseChat”2.0版突破了大語言模型輸入長度的限制,并推出不同參數量級的模型版本,可适配移動端、雲端等不同終端及場景的應用需求。今年4月首次釋出以來,生成式大模型“秒畫SenseMirage”3.0版的模型參數已從10億提升至70億量級,能完成專業攝影級的圖檔細節刻畫。

“商湯日日新”大模型體系全面更新,為《三體》打造沉浸式科幻空間

“如影SenseAvatar”2.0版數字人生成平台與1.0版相比,數字人的語音和口型流暢度提升30%以上,實作了4K高清視訊效果,并增加了生成形象及數字人歌唱功能。“瓊宇SenseSpace”2.0版的空間重建效率提升20%,渲染性能提升50%,每100平方公裡場景的建圖時間僅需38小時即可完成。“格物SenseThings”2.0版對小物體的紋理及材質還原達到毫米級精細度,并突破了對高反光和鏡面物體的采集難題。

“商湯日日新”大模型體系全面更新,為《三體》打造沉浸式科幻空間

徐立介紹,依托大模型體系在底層技術上的快速疊代,商湯正在利用大模型的多模态能力賦能多個産業領域。

在金融領域,商湯與銀行、保險、券商等客戶合作,利用數字人開展智能客服、智慧營銷等工作,并通過接入大語言模型能力,提供投研分析、研報撰寫等新功能,實作降本增效。挂載金融知識庫後,數字人還能100%基于客戶的産品說明進行内容問答輸出,并實作資訊及時更新。

在醫療場景,商湯基于海量醫學知識和臨床資料,打造了中文醫療語言大模型“大醫”。它在導診、問診、健康咨詢、輔助決策等場景中具備多輪會話能力,即将有能力支援醫學圖像、文本、結構化資料等多模态綜合分析,并不斷提升醫療語言了解和推理能力。

結合“商量”2.0版和“秒畫”3.0版的綜合能力,公司還為移動終端客戶帶來多種智能互動解決方案。在以劉慈欣小說《三體》為故事藍本打造的《三體·引力之外》沉浸式科幻體驗空間,商湯利用大模型的能力突破想象力邊界,創作出極具未來感的科幻航程。

“商湯日日新”大模型體系全面更新,為《三體》打造沉浸式科幻空間

在智能汽車領域,商湯“絕影”智能座艙、智能駕駛、車路協同等行業應用也在大模型的加持下,突破創新邊界。在智能座艙裡,通過視覺、聽覺等多模态融合,全方位感覺使用者需求,并通過标簽化資料記錄使用者習慣和偏好,提供專屬個性服務。

“商湯日日新”大模型體系全面更新,為《三體》打造沉浸式科幻空間

在車艙外,依托“大模型+大裝置”,“絕影”部署端雲協同,統一流量入口,支援私有化部署及千萬量級的應用需求。在近日舉行的2023年CVPR(國際計算機視覺與模式識别會議)上,商湯與合作機關提出了感覺決策一體化的自動駕駛通用大模型UniAD,開創了以全局任務為目标的自動駕駛大模型架構,相關論文摘得CVPR最佳論文獎,為自動駕駛技術與産業發展提出了新的方向。

基于此,公司正在打造車路雲協同的交通體系,借助多模态、多任務通用大模型開發路側視覺感覺大模型,并結合“瓊宇”2.0版和“格物”2.0版,建構智能交通孿生與仿真,推動車路雲共同向大模型的對話式互動模式演進。

欄目主編:黃海華

來源:作者:俞陶然

繼續閱讀