天天看點

商湯何以跑出大模型落地的「逃逸速度」?

作者:金泰資訊
商湯何以跑出大模型落地的「逃逸速度」?

當商湯董事長兼CEO徐立在一面頗具中國風的背景面前釋出全新更新的「日日新SenseNova 5.0」大模型體系,預示着商湯成為了首家實作了雲端邊全棧布局的企業,而正是在這樣一面背景之上,赫然寫着「AI大模型時代 II」。

于是,人們不禁會問,商湯何以跑出了大模型落地的「逃逸速度」,實作了大模型性能超越GPT-4 Turbo的呢?

如果我們對商湯日日新5.0大模型以及商湯背後強大的算力支撐,有一個全面的了解,便不會對此有任何的驚訝。

正如徐立所言,「商湯在尺度定律的指導下,會持續探索大模型能力的KRE三層架構(知識-推理-執行),不斷突破大模型能力邊界。」以此為基點,我們或許能夠找到商湯跑出大模型落地的「逃逸速度」的内在邏輯。

商湯日日新5.0性能全面超越GPT-4 Turbo

自去年4月正式上線以來,商湯日日新大模型系統已經完成了五大版本的疊代更新。而此次更新,主要是基于超過10TB tokens訓練、覆寫大量合成資料,采用混合專家架構,推理時上下文視窗可以有效到 200K 左右,以及聚集增強了知識、數學、推理及代碼能力,全面對标 GPT-4 Turbo,主流客觀評測上達到或超越 GPT-4 Turbo。

得益于這些更新,日日新5.0的「文科能力」、「理科能力」以及多模态能力,全面得到了一次質的提升。

以日日新5.0和GPT-4回答趣味推理問題為例:“媽媽給圓圓沖了一杯咖啡,圓圓喝了半杯後,将它加滿水,然後她又喝了半杯後,再加滿水,最後全部喝完。問圓圓喝的咖啡多,還是水多?”,日日新5.0回答正确,GPT-4回答錯誤。

日日新5.0的這些能力的提升,可以在中文語境下,更好地為使用者進行總結和問答,助力教育、内容等行業場景應用的落地。

同時,日日新5.0的數理能力、代碼能力以及推理能力的大幅度提升,同樣可以為金融、資料分析等場景的應用,提供有力支撐。

除了「文科能力」、「理科能力」之外,日日新5.0的多模态能力,同樣表現優異。它不僅支援高清長圖的解析和了解以及文生圖互動式生成,還可以實作複雜的跨文檔知識抽取及總結問答展示,還具備豐富的多模态互動能力。

商湯多模态大模型的圖文感覺能力達到全球領先水準,在多模态大模型權威綜合基準測試MMBench中綜合得分排名首位,在多個知名多模态榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領先成績。

可見,商湯日日新5.0在「文科能力」、「理科能力」以及多模态能力上的突出表現,為其更好地助力大模型場景落地打下了堅實的基礎。它不僅在主觀評測上全面達到或者超越了GPT-4 Turbo,更加可以在中文環境下助力更多本土企業積極擁抱大模型時代帶來的紅利。

是以,如果我們要尋找商湯日日新5.0跑出大模型落地的「逃逸速度」的内在邏輯的話,文理兼修的全面發展以及多模态互動的卓越表現,無疑是最值得我們去關注的一個重要方面。

雲端邊全棧布局,商湯打造大模型産品矩陣

随着AI時代的來臨,特别是當中心化算力需求向端側擴充以及企業級邊側AI需求的不斷增加,隻有實作雲、端、邊的高效協同,才能真正助力大模型的落地。

正是基于這樣一種認知,商湯在業内首次推出「雲、端、邊」全棧大模型産品矩陣,其中包括應用于終端裝置的「商湯端側大模型」,以及面向金融、代碼、醫療、政務等多個領域的邊緣産品「商湯企業級大模型一體機」。

據悉,商湯日日新·端側大語言模型的推理速度達到了業内最快,可在中端平台實作18.3字/s的平均生成速度,旗艦平台更是達到了78.3字/s。

擴散模型同樣可在端側實作業内最快的推理速度,端側LDM-AI擴圖技術在某主流平台上,推理速度小于1.5秒,比友商雲端app快10倍,支援輸出1200萬像素及以上的高清圖檔,支援在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

值得一提的是,為了滿足金融、代碼、醫療、政務等重點行業邊緣側日益增長的AI應用需求,商湯正式推出企業級大模型一體機,可同時支援企業級千億模型加速和知識檢索硬體加速,實作本地化部署,即買即用,降低企業應用大模型的門檻。相比行業同類産品,推理成本節約80%,檢索大大加速,CPU工作負載50%。

得益于商湯在雲、端、邊的全棧布局,商湯可以讓AI大模型在更多的企業落地,讓每一個企業的需求都能夠得到最大限度的滿足。

正因如此,

在辦公領域,商湯基于“日日新”大模型的卓越代碼生成及工具調用能力,助力WPS 365打造更高效釋放場景能力的辦公新質生産力平台,為企業建構專屬的“企業大腦”。

在金融領域,海通證券與商湯科技聯合釋出金融行業多模态全棧式大模型,雙方在智能客服、合規風控、代碼輔助、展業辦公助手等領域助推業務落地,并共研智能投顧、輿情監控等行業前沿場景,打通證券行業大模型落地的全棧式能力。

在出行領域,基于商湯端雲大模型解決方案,小米小愛同學為車主提供智能化互動體驗。

可以預見的是,随着商湯日日新5.0的雲、端、邊全棧布局的不斷深入,我們還将會看到更多的企業在商湯的助力之下實作AI應用的快速落地,不斷地去擁抱AI時代來臨的紅利。

算力加持,商湯找到遵循「尺度定律」的路徑

無論是日日新5.0的全面更新,亦或是商湯基于雲端邊的全棧布局,其實都離不開商湯打造的算力中心的加持與支撐。

正如商湯董事長兼CEO徐立所說的那樣,商湯持續尋求最有資料配比并建立資料品質評價體系,推動自身大模型研發的同時,也為行業夥伴提供大模型訓練、微調、部署和各類生成式AI的能力及服務。

在本次技術交流日最後環節,商湯科技董事長兼CEO徐立還帶來了三段完全由大模型生成的視訊,并強調文生視訊平台對于人物、動作和場景的可控性。

商湯科技在文生視訊平台方面也取得了技術突破,未來,通過輸入一段文字或一個完整的描述,就可以生成一段視訊,而且人物的服飾、發型、場景都可以根據預先設定,保持視訊内容的連貫性和一緻性。

不難看出,商湯的文生視訊,已經在路上了。

可以說,商湯找到了遵循「尺度定律」的路徑。

正是基于這樣一個全新的路徑,商湯才可以不斷地實作日日新5.0的更新,才可以打造了雲、端、邊的全棧布局,才可以滿足越來越多的企業對于AI的新需求。

是以,如果我們要尋找商湯跑出大模型落地的「逃逸速度」的内在原因的話,商湯智能算力中心在背後的強大加持,無疑是最值得我們去關注的另外一個重要方面。

結語

從日日新5.0的知識、數學、推理及代碼能力,全面對标 GPT-4 Turbo,主流客觀評測上達到或超越 GPT-4 Turbo,到業内首次實作雲端邊全棧布局,再到商湯對于合作夥伴的深度賦能,乃至是商湯對于AGI時代的全面擁抱,我們都可以看出,商湯着實跑出了大模型落地的「逃逸速度」。

當商湯日日新5.0的性能超越 GPT-4 Turbo,當商湯比 GPT-4 Turbo更懂中國的消費者和企業,商湯無疑可以在“尺度定律”路徑逐漸清晰的時刻,實作一次彎道超車,助力AI在更多場景落地,真正實作算法、算力、資料、應用和場景的全面協同。

—完—

作者:孟永輝,資深撰稿人,專欄作家,行業觀察家,知名KOL。