天天看點

國内大模型大消息!百度最新公布……騰訊、阿裡也有進展

作者:證券時報

國内大模型領域迎來一個重要時刻。

12月28日,百度首席技術官王海峰宣布,百度旗下的知識增強大語言模型——文心一言的使用者規模已突破1億。2023年3月,百度在國内科技公司中率先釋出知識增強大語言模型,到8月末,文心一言面向公衆開放後,使用者規模和提問數量一路攀升,開發者數量也大幅增長。

事實上,2023年大陸大模型領域不斷迎來積極進展。近日,全國首個官方“大模型标準符合性測試”結果公布,百度文心一言、騰訊混元大模型、360智腦、阿裡雲通義千問四款國産大模型首批通過測試,這也意味着這些廠商的相關技術要求,通用性、智能性等次元達到國家相關标準,未來可以在更廣泛的場景中應用,滿足不同行業和使用者的需求。

文心一言使用者數量突破1億

12月28日,在百度舉辦的“第十屆WAVE SUMMIT深度學習開發者大會”上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰宣布,百度文心一言使用者規模已突破1億。

“自8月31日獲準開放對公衆提供服務以來,文心一言的使用者提問量一路上揚,基本與文心大模型的效果提升同步,越來越多的使用者在信任和使用文心一言。”王海峰在上述大會現場表示。

券商中國記者了解到,百度自2019年起布局預訓練模型研發,釋出了“文心大模型1.0”。經過近四年積累,2023年3月,百度在全球科技大廠中釋出了知識增強大語言模型文心一言。同年8月31日,文心一言向全社會全面開放,并在短時間内使用者日活躍度超過百萬,登上AppStore首位。

實際上,百度年内已多次疊代旗下大模型的各項能力。2023年10月,文心一言的基礎模型更新到4.0,相較于上一個版本,文心大模型4.0在了解、生成、邏輯和記憶四大人工智能基礎能力得到全面提升。彼時,百度創始人李彥宏表示,文心4.0是迄今為止最強大的文心大模型,綜合水準“與GPT-4相比毫不遜色”。據王海峰最新透露,自文心大模型4.0釋出以來,該模型在過去2個多月整體效果又提升了32%。

據百度智能雲官網最新披露,百度文心大模型調用量居國内首位,日均調用量達數千萬次,每月服務企業超過1萬家;截至2023年11月,文心一言使用者數超過7000萬,覆寫場景4300個。企業使用者可通過百度智能雲“千帆大模型”平台調用文心大模型,目前,千帆平台累計服務超過4萬家企業使用者,累計幫助企業精調近1萬個大模型。

在12月28日的大會現場,王海峰還介紹了百度旗下深度學習平台——百度“飛槳”生态的最新成果:截至2023年12月底,飛槳已凝聚1070萬開發者,服務23.5萬家企事業機關,基于飛槳建立了86萬個模型。

四家國産大模型通過官方測試

事實上,2023年以來,大陸大模型領域不斷取得進展,多家科技公司宣布進入大模型賽道,并陸續有各大廠商釋出相關産品,并展示各自特點與優勢。

在此背景下,中國電子技術标準化研究院發起“大模型标準符合性評測”,以開展模型的了解能力、生成能力、安全性等30多個次元評測,為評估大模型能力水準提供全面的測試報告。據了解,該評測對外征集了學術界、産業界幾十家頭部機關意見,圍繞多元度展開,涵蓋語言、語音、視覺等多模态領域,是基于官方大模型測試基準的權威評測。

12月22日,全國資訊技術标準化技術委員會人工智能分委會全體會議公布了全國首個官方“大模型标準符合性測試”結果:百度文心一言、騰訊混元大模型、360智腦、阿裡雲通義千問四款國産大模型率先通過測試,符合《人工智能大規模預訓練模型 第2部分:評測名額與方法》語言大模型的相關技術要求,通用性、智能性等次元達到國家相關标準。

據券商中國記者梳理,通過首個官方标準的四家國産大模型各自具有自身特點和優勢。

據了解,阿裡雲通義千問是上述四家大模型中唯一的開源大模型。據阿裡雲介紹,通義千問大模型在全球擁有廣泛的開發者使用者和企業客戶,其性能表現及安全性得到了大範圍的公開檢驗。阿裡雲方面稱,阿裡雲已開源通義千問18億、70億、140億、720億參數的4款大語言模型,在多個相關評測中創下開源模型的優異成績。

騰訊旗下的混元大模型釋出時間相對較晚,據介紹,混元大模型擁有超千億的參數規模、超2萬億tokens的預訓練語料,具備強大的中文創作能力,複雜語境下的邏輯推理能力以及可靠的任務執行能力。

而360集團釋出的360智腦大模型則側重于安全性,360表示,公司自研的360智腦大模型擁有千億級參數規模,具備生成創作、多輪對話、邏輯推理等十大核心能力,依托自身在安全領域的積累和優勢,成為全國首個原生安全的大模型。

大模型商業化程序不斷提速

2023年,大陸語言大模型市場規模實作較快提升,在商業化程序方面也在不斷提速。

據央視新聞近日報道,工業和資訊化部賽迪研究院資料顯示,目前,大陸已有超過19個語言大模型研發廠商,其中,15家廠商的模型産品已經通過備案。預計2023年,大陸語言大模型市場規模将達到132.3億元,增長率将達到110%。

展望未來,有行業專家預測,到2027年,中國的語言大模型市場規模有望達到600億元。此外,賽迪研究院資料顯示,中國生成式人工智能市場也呈現出強勁的增長勢頭,今年市場規模預計将超過10萬億元。在2023年,生成式人工智能的企業采用率達到15%,市場規模約為14.4萬億元。在制造業、零售業、電信行業和醫療健康等四大行業的生成式人工智能技術的采用率均取得較快增長。

此外,中國資訊通信研究院有關負責人此前曾表示,大模型作為産業智能化基座,在識别、了解、決策、生成等任務中表現出泛化性、通用性、遷移性潛力,與實體經濟深度綁定,在金融、工業、能源等領域進一步落地,持續釋放技術紅利。

責編:汪雲鵬

校對:王朝全

繼續閱讀