天天看點

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

作者:量子位

金磊 發自 WAIC

量子位 | 公衆号 QbitAI

商湯“日日新”AI大模型,如其名,真的做到了日日新。

這不,從釋出到現在,時隔僅僅3個月,商湯便正式宣布:

商湯日日新(SenseNova)大模型體系全面更新。

那麼這個更新版本又有哪些優化?

話不多說,直接上結果。

例如基于日日新的千億參數語言大模型商量2.0(SenseChat),在三個全球權威測評基準中的表現,均超越了ChatGPT:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

△各大語言模型在MMLU、AGIEval、C-Eval三個評測基準中得分情況

除此之外,基于日日新的其它各大AIGC平台,這次也一口氣也都來了個大更新:

  • 秒畫3.0(SenseMirage):參數量提升至70億量級,實作專業攝影級圖檔細節刻畫。
  • 如影2.0(SenseAvatar):語音和口型流暢度提升30%以上,實作4K高清視訊效果。
  • 瓊宇2.0(SenseSpace):空間重建效率提升20%,渲染性能提升50%。
  • 格物2.0(SenseThings):渲染精度大幅提升,對物品紋理及材質的還原達到毫米級精細度。

在現場,商湯CEO徐立也拿着秒畫3.0搞起了花活:

人沒去CVPR 2023現場領獎(商湯斬獲今年最佳論文),那就直接讓秒畫來生成。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

不會彈吉他、不會畫畫,沒關系,繼續生成:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

咱就是說,城會玩兒了。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

那麼全新更新的日日新,更多産品的具體表現如何?我們繼續往下看。

不隻是超越了ChatGPT這麼簡單

1、讓老子和孔子對話

整體來看,商量的模型基礎能力在2.0版本有了大幅的提高,這點我們從上文提到的性能超越ChatGPT便可有直覺感受。

在模型的體系方面,商湯除了推出商量2.0(SenseChat XL)之外,還推出了一個商量S版(SenseChat S),也就是小模型版本。

徐立便在現場展示了用這兩個模型展示了一波“孔子對話老子”的情景:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

在語言方面,它新增了一些地區語言,例如阿拉伯語和粵語等;以及支援簡體中文、繁體中文、英語等多種語言互動。

同樣是這場“孔子對話老子”,粵語版本是這樣的:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

同時,商量2.0還突破了大語言模型輸入長度的限制。

例如給它一個指令:将超長的英文文本總結為中文概要,商量2.0便可立即執行這樣複雜的任務。

不僅如此,使用者還可以基于此進一步進行多輪對話:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

最後,商量2.0還釋出了一個“外挂”——知識庫挂載:

無需訓練模型,就可以快速融合知識生成;搭配企業知識庫可以快速解決相關領域問題。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

2、生成攝影級圖像,提示詞可以自動補充了

在文生圖方面,商湯的秒畫更新到了3.0版本,從功能更新的内容上來看,主打的就是一個“突破想象力”。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

例如在輕量級方面,現在每個人都能通過拖拽的動作,在10分鐘内微調模型,并且定制化個人專屬的生成AI。

我們在上面提到的徐立“搞花活”便是個很好的例子。

在“智能化”方面,根據提示詞(prompt)來生成AI繪畫作品不會再變得很繁瑣,因為現在就連提示詞都可以自動補充了。

以往我們想讓AI生成一條龍,可能就會輸入“中國龍”、“藍色擺件”、“珠寶風格”,但往往由于提示詞過于簡單,并不能達到特别精細的效果。

而現在,同樣是隻輸入這三個短語,秒畫3.0會自動對提示詞做補充,然後生成更為驚豔的作品:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

再來感受一下提示詞“陽光下的塑膠袋”,在被自動擴充後的效果:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

最後在效果方面,秒畫3.0現在生成的圖像,無論是成片水準還是細節與元素,都能夠達到影視級的效果。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

除了單打獨鬥的能力之外,當商量2.0和秒畫3.0結合之後的多模态大模型,也衍生出了一種新玩法——熱點事件了解。

在對話過程中“喂”它一張圖檔或視訊,便可以看圖說話,更加深入且精準的描述素材中的内容。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

3、延參法師也“來現場”了

數字人方面的如影2.0也是本次商湯産品大更新的重點。

這不,在現場商湯便展示了延參法師等知名人物的數字人效果,無論是聲音(口音)亦或是神情,真的可以說是栩栩如生。

視訊加載中...

還有包括主持人張泉靈、經濟學家任澤平、上交大教授季衛東等等,堪稱上演了一出“百變大咖秀”。

在語言方面,如影2.0打造的數字人在英語、日語、西班牙、阿拉伯語等多語種的精準度提升30%以上,而且口型和語音比對得更加自然。

在生成效果方面,如影2.0支援實作影級4K高清視訊的輸出,可以讓成片更加精良。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

如影的更新也同樣帶來了一種新玩法——

現在,使用者可以通過輸入提示詞自動生成與描述比對的專屬數字人形象了!

而且還是可以實作數字人歌唱功能的那種。

視訊加載中...

這便極大地降低了虛拟網紅、數字人短片等内容生成的門檻。

4、無論1萬平米還是1毫米都能hold住的3D重建

最後在3D重建、數字孿生領域,商湯同樣帶來了大更新——瓊宇2.0和格物2.0。

先來看下這樣一個恢弘的場景:

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

如果不說這是瓊宇2.0 3D重建的結果,或許很多小夥伴都會以為是航拍的視訊了。

據了解,瓊宇2.0目前已經實作了厘米級三維重建精度,室外每1萬平米精度達5厘米,室内每1000平米精度達1厘米。

同時,重建效率提升20%,渲染性能提升50%,100平方公裡場景的建圖時間僅需38小時即可完成(1200 TFLOPS/秒算力支援)。

除了這種宏觀場景的3D重建之外,在微觀層面上的3D重建能力,随着格物疊代到2.0版本也有了大幅提升——

對物品紋理及材質的還原達到毫米級精細度,能夠帶來更清晰、更真實的産品細節體驗。

更重要的是,格物2.0還突破了高反光和鏡面物體采集這種老大難的問題,是無需貼紙或标簽,即可精确還原商品的外觀和特征的那種。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

不難看出,日日新大模型在步入2.0時代之後,各項AIGC平台的能力都有了顯著的提升。

那麼接下來的一個問題便是:

如何在3個月内做到的大更新?

早在三個月前,商湯站在AGC新時代下,圍繞資料、算法和算力三要素給出了一個新公式:

計算量(GPU數量 x 運作時間 x 并行效率 )= 模型參數量 x 處理資料量。

我們先來看下等式右邊的兩個因素:

模型參數量要足夠多,才能實作AI智慧的湧現,而這也帶來了對算力的劇增,需要更高的并行效率,才能有效支援大參數模型訓練。

資料方面,高品質自然語言資料逐漸稀缺,而視覺資料相較自然語言在數量、品質、容納資訊等方面有多種優勢,能夠使得AI更好地了解世界。

二者的深度結合,便有了等式左邊的計算量;而之于這兩者,商湯有自己的一套“打法”——

大模型+大裝置。

首先便是大模型方面,日日新雖然是商湯于數月前釋出,但它并非是這一波AIGC熱潮中一蹴而就的産物。

因為早于5年前,商湯便已經着手于此,而且在2019年便使用上千張GPU進行單任務訓練,推出了10億參數規模的視覺模型,算法效果達到了當時業界最佳。

在後來的2021年至2022年期間,商湯還訓練并開源了30億參數的多模态大模型“書生”。

是以,商湯能夠迅速推出千億參數大模型并實作版本疊代,可以視為是長期以來各種“小作業”的彙總而成的“大作業”。

其次是在大裝置方面,也就是商湯在大算力中的“打法”,它與自身大模型的發展也有異曲同工之妙——同樣也是早有布局。

在2022年1月,商湯傳遞使用了首付高達56億元的人工智能計算中心(AIDC),而且是“出道”即成為亞洲最大的AI超算中心之一。

一年前它的算力就已經高達了3740 Petaflops,可以輕松應對萬億參數的大模型;而時隔僅1年,這個數值便翻了一小番,達到了5000 Petaflops。

這又是什麼概念呢?

舉個例子,在如此大裝置的加持之下,它可以以最大4000卡規模叢集進行單任務訓練,并可做到七天以上不間斷的穩定訓練。

……

總而言之,有大資料、有大算力、有大模型,是以商湯能讓日日新在3個月内完成版本疊代也就不難了解了。

但有一說一,這還是“商湯速度”的一隅而已。

大模型的落地也在提速

“商湯速度”的另一面,正是展現在了落地應用上。

如果你認為日日新的全面更新隻是一個“提出”和“宣布”的動作,那就大錯特錯了,因為它已經是“上崗”了的那種。

例如結合商量2.0和秒畫3.0的能力,商湯在移動端給客戶帶來了多種互動方面的“解法”。

針對資訊擷取的問答互動、生活場景的知識互動、語言和圖像生成的内容互動等等,正因為商湯的大模型擁有輕量化版本,是以可以輕松在移動端上部署。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

再如瓊宇2.0為濟南馬山鎮區域開發、合肥中國視界園區、上海瑞金醫院等真實線下場景,打造了相對應的數字孿生,使得營運效率得到了大幅提升。

商湯還通過大模型能力為電網巡檢帶來長尾故障識别、複雜缺陷判斷等智能解決方案。

而且商湯産品的更新,并非是單打獨鬥的那種,而是強強聯手出奇迹。

例如我們剛才提到的“熱點事件了解”便是其中之一,除此之外,商湯在智能汽車領域的絕影,更是融合了多個“看家本領”。

例如多模态大模型(多模态感覺)、語言大模型(車艙大腦)、知識融合(專屬記憶子產品)和AIGC大模型(定制數字人)等等。

商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力

也正如徐立在現場所述:

大模型的突破掀起了人工智能的新一輪技術革命,随之而來的是産業需求呈現爆炸式增長,全新的應用場景和應用模式正迅速湧現。

商湯希望通過‘大模型+大裝置’持續推動AI基礎設施能力的躍進提升,不僅打造通用能力更加強大的基礎模型,也進一步高效融合不同垂直領域的專業知識,建構更懂行業、更具專長的專業大模型,從根本上降低大模型的下遊應用成本和門檻,讓大模型的産業價值在千行百業中綻放。

總而言之,現在的大模型之戰,不僅是拼技術疊代的速度,更是拼應用和落地的速度。

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态

繼續閱讀