21世紀經濟報道記者白楊 深圳報道
去年底,ChatGPT的橫空出世,讓AI大模型受到全球矚目。過去大半年,大模型産品如雨後春筍般不斷湧現,但在百花争豔過程中,騰訊卻遲遲未出招。
此前,業内多位權威人士均分析認為,未來的大模型生态,隻會有屈指可數的通用大模型保留下來。騰訊也一直被認為是實力玩家之一。
在9月7日召開的2023年騰訊全球數字生态大會上,騰訊混元大模型正式亮相。
據介紹,騰訊混元大模型是由騰訊全鍊路自研的通用大語言模型,擁有超千億參數規模,預訓練語料超2萬億tokens,其中文創作能力、邏輯推理能力和任務執行能力,将通過騰訊雲對外開放。
過去一周,随着國家網信辦釋出境内深度合成服務算法備案資訊,諸多大模型産品也開始從内測轉向公測。而騰訊混元大模型目前也已認證備案,某種意義來講,騰訊與國内其他廠商,現在又站在了同一起跑線上。
不要“半成品”
如果從技術儲備來看,騰訊現在才釋出大模型産品,其實是一種主動的腳步放緩。
據21世紀經濟報道記者了解,騰訊早在2021就開始探索大模型相關技術。從2021年開始,騰訊先後推出千億和萬億參數的NLP稀疏大模型。關于混元AI大模型,騰訊在2022年4月首次對外披露相關研發進展。據當時的資訊,混元AI大模型完整覆寫了NLP(自然語言處理)、CV(計算機視覺)、多模态等基礎模型和衆多行業模型。
騰訊如果想在上半年跟風釋出一款大模型産品,并非難事。但騰訊沒有這樣做,為什麼?對此,在今年5月舉辦的騰訊2023年股東大會上,騰訊董事會主席兼CEO馬化騰做了非常清晰的诠釋。
馬化騰當時表示,“我們最開始以為這是網際網路十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。網際網路企業都有很多的積累,都在做,我們也一樣在埋頭研發,但是并不急于早早做完,把半成品拿出來展示。”
馬化騰認為,對于工業革命來講,早一個月把電燈泡拿出來在長的時間跨度上來看是不那麼重要。關鍵還是要把底層的算法、算力和資料紮紮實實做好,而且更關鍵的是場景落地,“相信我們是有很多場景是可以落地的,目前(我們)還在做一些思考”。
全鍊路自研
馬化騰的定調,擡升了外界對于騰訊大模型的預期,而這,也直接轉化成了騰訊研發團隊的巨大壓力。
過去半年,多位騰訊員工均向記者袒露了來自内部的壓力。作為混元大模型的負責人,騰訊集團副總裁蔣傑在接受21世紀經濟報道記者采訪時坦言,騰訊從2020年就開始研發混元,大家今天看到的成果,也不是一蹴而就的。準确來說,混元将永遠在路上,訓練資料集也會持續更新,而騰訊選擇此時将其亮相,是因為它已經達到了可用、可實踐的狀态。
據介紹,騰訊混元大模型擁有自主研發的路徑規劃,掌握了從模型算法到機器學習架構,再到AI基礎設施的全鍊路自研技術。
蔣傑表示,騰訊混元大模型之是以選擇從第一個token開始從零訓練,是因為不做自研,就無法對大模型技術進行完全的掌握,而且騰訊的高并發業務場景,也不适合使用開源模型。
在國内大模型紮堆的背景下,騰訊混元大模型也進行了諸多技術路線的探索和創新。得益于全鍊路自研技術,騰訊混元大模型已能夠了解上下文的含義,并且有長文記憶能力,可以流暢地進行專業領域的多輪對話。
強調“實用”
在大會上,騰訊還抛出了一個新概念,即“實用級”大模型。在騰訊看來,目前大模型在處理簡單任務和高容錯率場景方面表現較好,但要讓其更可靠地處理複雜資訊,仍面臨較大的技術挑戰。
“實用級”大模型可以了解為,在實際應用場景中,能夠有效解決問題、提高工作效率,并在多個領域和任務上具有較高準确性和可靠性的大模型。這類模型不僅在簡單任務上表現優秀,而且能夠應對複雜資訊處理,為客戶和使用者帶來實際價值。
“實用級”大模型的價值,首先展現在騰訊内部。蔣傑表示,“騰訊研發大模型的目标不是在評測上獲得高分,而是将技術應用到實際場景中。騰訊将全面擁抱大模型。”
今年3月的财報電話會議上,騰訊總裁兼投資委員會主席劉熾平曾表示,AI将成為公司未來業務增長的倍增器。生成式AI和基礎模型技術可以補充優化騰訊的業務。是以,公司将積極投入資源來建構基礎大模型,這将在未來對每個業務線都起到正向補充作用。
目前,騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ浏覽器等超過50個騰訊業務和産品,已經接入騰訊混元大模型測試,并取得初步效果。
大會上,蔣傑也展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務,在接入騰訊混元大模型後的實際應用情況。
而面向外部客戶,騰訊混元大模型則将作為騰訊雲MaaS服務的底座,客戶不僅可以直接通過API調用混元,也可以将混元作為基底模型,做自己專屬的行業大模型。
蔣傑稱,今年6月,騰訊對外釋出了行業大模型的相關解決方案,當時是隻在幾個行業做好了準備,而現在,騰訊混元可以支援更多行業。
毫無疑問,大模型時代正加速到來。截至7月,國内已經釋出超130個大模型,真正掀起了百模大戰。在過去二十年,騰訊憑借QQ和微信,在PC網際網路和移動網際網路時代占據了一席之地,現在值得關注的是,混元大模型能否幫助騰訊拿到大模型時代的“船票”?
更多内容請下載下傳21财經APP