天天看點

首家實作大模型雲端邊全棧布局!商湯“日日新SenseNova 5.0”全面更新

作者:讀創網

深圳商報·讀創用戶端記者 塗競玉

4月23日,商湯科技SenseTime舉辦技術交流日活動,釋出行業首個“雲、端、邊”全棧大模型産品矩陣,以滿足不同規模場景的應用需求,并且全新更新“日日新SenseNova 5.0”大模型體系,其綜合能力全面對标GPT-4 Turbo,技術領跑加速生成式AI向産業落地的全面躍遷,實作大模型按需所取。

在人工智能發展的最基本法則——尺度定律(Scaling Law)的準則下,商湯持續尋求最有資料配比并建立資料品質評價體系,推動自身大模型研發的同時,也為行業夥伴提供大模型訓練、微調、部署和各類生成式AI的能力及服務。

商湯科技董事長兼CEO徐立表示:“商湯在尺度定律的指導下,會持續探索大模型能力的KRE三層架構(知識-推理-執行),不斷突破大模型能力邊界。”

首家實作大模型雲端邊全棧布局!商湯“日日新SenseNova 5.0”全面更新

新增多模态互動,文理雙修能力大幅提升

自去年4月首次釋出,商湯“日日新SenseNova”大模型體系已正式推出五個大版本疊代。基于超過10TB tokens訓練、覆寫大量合成資料,全新的“日日新SenseNova 5.0”(以下簡稱:日日新5.0)采用混合專家架構,推理時上下文視窗可以有效到 200K 左右。

本次更新主要聚集增強了知識、數學、推理及代碼能力,全面對标 GPT-4 Turbo,主流客觀評測上達到或超越 GPT-4 Turbo。

在文科能力方面,“日日新5.0”的創意寫作能力、推理能力以及總結能力均大幅提升,相同的中文知識注入後,可以獲得更好的了解總結及問答,為教育、内容産業等垂直應用場景提供有力輔助。

“日日新5.0”和GPT-4回答趣味推理問題:“媽媽給圓圓沖了一杯咖啡,圓圓喝了半杯後,将它加滿水,然後她又喝了半杯後,再加滿水,最後全部喝完。問圓圓喝的咖啡多,還是水多?”“日日新5.0”回答正确。

在理科能力方面,“日日新5.0”數理能力、代碼能力及推理能力達到業内領先水準,為金融、資料分析等場景落地提供堅實基礎。

本次“日日新5.0”另一大核心名額就是多模态能力,商湯多模态大模型的圖文感覺能力達到全球領先水準,在多模态大模型權威綜合基準測試MMBench中綜合得分排名首位,在多個知名多模态榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領先成績。

“日日新SenseNova5.0”在應用産品層面也實作了更卓越的多模态能力,支援高清長圖的解析和了解以及文生圖互動式生成,還可以實作複雜的跨文檔知識抽取及總結問答展示,還具備豐富的多模态互動能力。

首家實作大模型雲端邊全棧布局!商湯“日日新SenseNova 5.0”全面更新

端側模型位列行業首位,邊側推出企業級應用一體機

前瞻洞察中心化算力需求向端側擴充的未來趨勢及企業級在邊緣側的AI需求,商湯科技領先業内首次推出“雲、端、邊”全棧大模型産品矩陣,其中包括應用于終端裝置的“商湯端側大模型”,以及面向金融、代碼、醫療、政務等多個領域的邊緣産品“商湯企業級大模型一體機”。

今年是端側大模型應用的元年,為了滿足移動終端使用者對大模型技術的應用需求,商湯推出日日新·端側大模型,性能實作同等尺度性能最優,跨級尺度全面領先。

商湯還推出端雲協同解決方案,可以通過智能化判斷協同發揮端雲各自優勢,需要聯網搜尋或處理複雜場景時分流至雲端處理,部分場景端側處理占比超過80%,進而顯著降低推理成本。

商湯日日新·端側大語言模型的推理速度達到了業内最快,可在中端平台實作18.3字/s的平均生成速度,旗艦平台更是達到了78.3字/s。

擴散模型同樣可在端側實作業内最快的推理速度,端側LDM-AI擴圖技術在某主流平台上,推理速度小于1.5秒,比友商雲端app快10倍,支援輸出1200萬像素及以上的高清圖檔,支援在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

對于金融、代碼、醫療、政務等重點行業邊緣側日益增長的AI應用需求,商湯正式推出企業級大模型一體機,可同時支援企業級千億模型加速和知識檢索硬體加速,實作本地化部署,即買即用,降低企業應用大模型的門檻。相比行業同類産品,推理成本節約80%,檢索大大加速,CPU工作負載50%。

首家實作大模型雲端邊全棧布局!商湯“日日新SenseNova 5.0”全面更新

聯合生态夥伴,創新AI 2.0時代産品應用

本次活動現場,商湯還邀請到金山辦公、海通證券、小米、閱文集團、華為等多位生态夥伴嘉賓,共同探讨和交流大模型技術在辦公、金融、出行等不同領域的應用及前景。

自2023年起,商湯與金山辦公達成深度合作,基于“日日新”大模型的卓越代碼生成及工具調用能力,助力WPS 365打造更高效釋放場景能力的辦公新質生産力平台,為企業建構專屬的“企業大腦”。金山辦公CEO章慶元表示:“在辦公應用場景内,商湯大模型的表現十分出色,能夠幫助我們的使用者解決辦公中的複雜問題,提升效率。”

在金融領域,海通證券與商湯科技聯合釋出金融行業多模态全棧式大模型,雙方在智能客服、合規風控、代碼輔助、展業辦公助手等領域助推業務落地,并共研智能投顧、輿情監控等行業前沿場景,打通證券行業大模型落地的全棧式能力。海通證券副總經理兼首席資訊官 毛宇星談到:“通過與商湯合作,我們利用大模型技術實作了海通證券數智化轉型,未來,我們将結合全棧式AI能力進行業務流程、互動變革與數智化業務系統重構。”

在個人出行場景,近期火爆市場的小米汽車SU7的智能車艙中就應用了商湯的大模型技術,基于商湯端雲大模型解決方案,小米小愛同學為車主提供智能化互動體驗。小米集團小愛總經理王剛在與商湯科技聯合創始人、首席科學家王曉剛對話時表示:“商湯的雲邊端全棧組合,可以很好地賦能和适配小米物聯網生态。我們希望與商湯共同為我們的使用者打造更具智能化的産品體驗。”

此外,今天商湯還釋出了基于昇騰原生的行業大模型,共同打造面向金融、醫療、政務、代碼等大模型産業生态。

在自身應用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫、小浣熊家族等産品均有重要更新。