天天看點

又一公司入局大模型,商湯推出“日日新SenseNova”優勢是什麼?

商湯聯合創始人、首席科學家王曉剛認為,商湯入局大模型有兩個優勢:第一是基礎設施,第二是商湯在過去幾年深入行業和場景,積累了各種各樣多模态任務,這些好比是原材料。

騰訊新聞《潛望》劉勇

2023年4月10日,商湯科技SenseTime舉辦技術交流日活動,公布以“大模型+大算力”推進AGI(通用人工智能)發展的戰略布局,并公布商湯在該戰略下的“日日新SenseNova”大模型體系,推出自然語言處理、内容生成、自動化資料标注、自定義模型訓練等多種大模型及能力。

活動上,商湯展示了“日日新SenseNova”大模型體系下的語言大模型,以及AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,并公布了商湯依托AI大裝置SenseCore實作“大模型+大算力”融合創新的研發體系。

據悉,商湯大裝置上共有27000塊GPU晶片卡,可以輸出5.0 exaFLOPS總算力,是亞洲目前最大的智能計算平台之一。

為什麼叫“日日新”? 商湯方面表示,“苟日新,日日新,又日新”選自中國儒家經典——《禮記·大學》,意思是如果能夠一天新,就應保持天天新,新了還要更新。這就像“日日新”大模型給産業帶來的全新的生産力革命,在商湯科技已經将AGI的服務沁入企業生産及生活中,悄然掀起了一場生産力的革新風暴。

商湯科技董事長兼CEO徐立在10日釋出會表示:“在AI大模型時代,資料、算法和算力這三要素也在經曆新的演變,大模型參數量将以指數級的速率提升,而資料量随着多模态的引入也将大規模增長,是以就必然會導緻對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎設施。”

“AGI催生了新的研究範式,即基于一個強大的多模态基模型,通過強化學習和人類回報不斷解鎖基模型新的能力,進而更高效地解決海量的開放式任務。AGI将實作從‘資料飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯合創始人、首席科學家王曉剛表示:“商湯已建立了全棧的大模型研發體系,并已在多個行業場景中落地,場景的多樣性,任務的複雜度,資料的豐富度均充分展示了我們大模型的能力和未來潛力。我們将持續推動基礎設施建設,期待和合作夥伴一起投入到AGI的時代大潮中。”

日前,王曉剛在談及商湯進入大模型領域的優勢時說,他認為商湯優勢有以下兩方面:

第一,在人工智能創業公司裡,很少看到像商湯這樣把大量資源投入到基礎設施建設的企業,商湯做了大裝置,除了有強大算力,還有5000 P算力,進而搭建了一個強大的訓練系統、超算系統。

第二,商湯作為平台性公司,覆寫了衆多行業線。在各個行業線,積累了不同類型的資料,還有對問題的描述。

“當我們要做一個通用的人工智能大模型,我們把它比喻成核聚變,要産生一個核武器,你要有核裝置,這就是我們一些基礎的硬體系統。你還得有核原料,核原料它就是要有一些各個行業裡非常豐富的資料也好,任務也好。”他說。

他接着說道,ChatGPT為什麼能成功?是因為它從網際網路上得到的這些資料後,會發現自然語言可以涵蓋多樣複雜的任務。但如果我們擴充到多模态,擴充到視覺,這些複雜的任務你沒辦法直接從網際網路裡面去拿到資料。

是以,在他看來,商湯做通用人工智能大模型的先天優勢,一個有很好的基礎設施,系統性的基礎設施。另一個是,商湯在過去幾年深入到行業和場景裡面,積累了各種各樣的多模态任務,這些作為原材料,最終讓這個模型能夠成功。

此外,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,包括圖檔生成,自然語言生成,視覺感覺通用任務與标注服務。客戶可根據實際應用需求,調用“日日新SenseNova”大模型的各項AI技術能力,低門檻、低成本、高效率地實作各類AI應用。

在“一平台四支柱”的戰略體系下,商湯“日日新SenseNova”大模型體系已支援了智能汽車、智慧生活、智慧商業、智慧城市等業務闆塊,打通了多個領域、行業的應用閉環。

在智能駕駛領域,大量的長尾類别需求,需要高精度車端模型。通過大模型生産高精度車端模型,大幅提升了few/one/zero shot在長尾類别中的精度,在重點關注的類别上,平均精度提升3%。此外,大模型提供了高精度的智能标注能力,為資料閉環提供了核心功能,大大減少了需要人工标注的資料量,加速了模型精度的提升。得益于大模型能力,商湯實作了BEV環視感覺,做到了3000類物體的高精度識别,還建構了感覺決策一體化的自動駕駛多模态大模型,帶來更強的環境、行為、動機解碼能力。

在生物醫藥領域,商湯AI大裝置為蛋白質結構大模型提供AI推理算力,并為蛋白質互相作用模型,提供研發平台及訓練算力。商湯與百英科技合作,訓練抗體親和力預測模型。通過高性能計算優化,蛋白質結構預測大模型推理時間由數小時減少到數分鐘,使得蛋白質結構預測性能達到工業應用的标準,抗體篩選效率提升60%。

數字時代的人-物-場已經逐漸被颠覆和重構,從商湯此次公布的中文自然語言、數字人生成、大場景漫遊、小物體重建、文生圖等多種API接口來看,企業可以根據自身的需求,更靈活的都調用大模型的各項AI能力,低門檻、低成本、高效率地實作AI技術在實際業務環節中的部署,切實的實作技術力向生産力的轉化。

同時,“日日新SenseNova”也為商湯的自身業務帶來了突破。例如在智能駕駛領域,基于視覺大模型,商湯實作了可識别3000類物體的BEV環視通用感覺算法的實車量産,也建構了感覺決策一體化的自動駕駛多模态模型,帶來更強的環境、行為、動機解碼能力。

自然語言是人機溝通的關鍵手段,“日日新SenseNova”也推出了商湯最新研發的語言大模型“商量SenseChat”。作為千億級參數的自然語言處理模型,“商量SenseChat”使用大量資料訓練,并充分考慮了中文語境,能夠更好地了解和進行中文文本。活動現場,“商量SenseChat”展示了出色的多輪對話和超長文本的了解能力。商湯也展示了語言大模型支援的幾項創新應用,包括:程式設計助手,可幫助開發者更高效地編寫和調試代碼;健康咨詢助手,為使用者提供個性化的醫療建議;PDF檔案閱讀助手,能輕松從複雜文檔中提取和概括資訊。

擴散模型引爆了AIGC應用的流行,商湯展示了“日日新SenseNova”的各種AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用:

“秒畫SenseMirage”文生圖創作平台,展現了光影真實、細節豐富、風格多變的強大的文生圖能力,可支援6K高清圖的生成;客戶還可根據自身需求訓練生成模型。

“如影SenseAvatar”AI數字人視訊生成平台,僅需一段5分鐘的真人視訊素材,就可以生成出來聲音及動作自然、口型準确、多語種精通的數字人分身。

“瓊宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。

“日日新SenseNova”帶來的這些強大而易用的内容生成能力,将會改變内容生産行業的生産範式,突破内容創意的天花闆,将會重塑内容生産行業生态并打開新的增長空間。

無論是語言大模型,還是文生圖或數字人生成,都離不開大規模AI基礎設施的算力支援。商湯AI大裝置SenseCore,擁有行業領先的算力輸出能力、超大模型訓練及大規模推理能力,将會成為AGI和大模型時代的基礎設施服務上司者。

基于AI大裝置SenseCore和“日日新SenseNova”大模型體系,商湯面向行業夥伴提供涵蓋自動化資料标注、自定義大模型訓練、模型增量訓練、模型推理部署、開發效率提升等多種大模型即服務(Model-as-a-Service):

基于預訓練大模型的自動化資料标注可實作相較于人工資料标注近百倍的效率提升。

大模型并行訓練和模型增量訓練服務能夠幫助客戶快速利用自有資料訓練模型,包括在預訓練大模型之上進行垂域行業模型的開發,生産千行千面的自定義模型。

模型推理部署服務可将大模型推理效率提高100%以上,降低用模型提供服務的成本。

商湯也向行業開發人員開放大量預訓練模型及AI開發工具鍊,全面賦能客戶提升開發效率。

AGI不是一場作秀式的狂歡節,而是生産力升維的契機。在ChatGPT成為程式員、畫師、創作者的過程中,商湯已經将AGI帶動的生産力疊代注入到更多的領域、行業、企業和場景中。可以說在駕馭AGI的道路上,商湯已經找到了關鍵的破局點。

繼續閱讀