騰訊正式加入大模型混戰!9月7日的2023騰訊全球數字生态大會上,騰訊混元大模型正式亮相,并宣布通過騰訊雲對外開放。至此,網際網路大廠的大模型産品已經悉數亮相。
談及網際網路企業在大模型釋出進度上的你追我趕,騰訊集團進階執行副總裁、雲與智慧産業事業群CEO湯道生在會後接受南都記者采訪時表示,目前這一賽道還不存在“追趕”,遠遠沒到出現清晰市場佔有率的階段,“ToB的技術以及市場滲透可能是以十年作為機關,大模型是一場馬拉松,現在可能才跑到一公裡。”
50多個業務接入,騰訊全面擁抱大模型
據介紹,騰訊混元大模型是騰訊自研的一款實用級通用大模型,目前已經接入騰訊50多個業務測試并取得初步效果,包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ浏覽器等業務和産品。
“騰訊混元大模型從第一個token開始從零訓練。”騰訊集團副總裁蔣傑介紹,騰訊掌握了從模型算法到機器學習架構,再到AI基礎設施的全鍊路自研技術。目前騰訊混元的參數規模超千億,預訓練語料超2萬億tokens,具備強大的中文創作能力,複雜語境下的邏輯推理能力,以及可靠的任務執行能力。
蔣傑同時展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務,在接入騰訊混元大模型後的實際應用情況。
比如,騰訊會議基于騰訊混元打造的AI小助手,隻需要簡單的自然語言指令,就能完成會議資訊提取、内容分析等複雜任務,會後還能生成智能總結紀要;在文檔處理方面,騰訊混元大模型支援數十種文本創作場景,在騰訊文檔推出的智能助手功能中已有應用;同時,騰訊混元還能夠一鍵生成标準格式文本,精通數百種Excel公式,支援自然語言生成函數,并基于表格内容生成圖表,目前這些功能正在内測階段,将在成熟後面向使用者開放;在廣告業務場景,騰訊混元大模型支援智能化的廣告素材創作,能夠适應行業與地域特色,滿足千人千面的需求,實作文字、圖檔、視訊的自然融合。
騰訊集團副總裁蔣傑
“我們研發大模型的目标不是在評測上獲得高分,而是将技術應用到實際場景中。騰訊将全面擁抱大模型。”蔣傑表示。在蔣傑看來,隻有全鍊路自研,才能做到優于行業水準,實作技術上的創新突破,同時全鍊路自研也會讓大模型在海量高并發的應用上跑起來時更為穩定,這是大模型和生成式AI實作規模化應用的必經之路,對于坐擁十多億使用者的騰訊更需要反複打磨,以保證海量使用者的使用體驗。“從最底層的伺服器、網卡,到整個高速的組網,包括平台、模型、算法都是基于騰訊自研的,這一定會讓我們在後續的疊代逐漸加快。另一方面,騰訊是一個海量高并發的業務,開源的架構不适應騰訊的體量,是以我們一定要走自主研發的道路,才能夠應對海量、高并發業務的沖擊。”蔣傑稱。
十年長跑開始,解決産業實際問題是關鍵
9月1日,網信辦釋出第二批深度合成服務算法備案資訊,包括騰訊混元大模型在内的多個生成合成類大模型通過備案。這意味着國内大模型的應用搶灘戰正式開啟。
“我們跟客戶交流,看到他們大都是多個模型在接入做測試。大家對于大模型有很高的期望、很多的設想,但又沒那麼清晰到底能解決什麼問題。”湯道生向南都記者表示,騰訊希望用大模型真正幫助他們解決問題。
可以看出,與騰訊會議、文檔、廣告等業務場景一同亮相的騰訊混元大模型,目前的主戰場依然是B端場景。
“現在大家都喜歡從TOC的角度,去關注和使用通用大模型。關注點可能會有些走偏,比如,很多人花很大精力去測試,讓一些通用大模型去亂說話,而不是解決産業實際問題和痛點。”湯道生稱,對于大模型最務實的應用還是,基于行業痛點,用行業大模型去解決問題,“可能剛開始使用的版本,隻能解決問題的80%,但因為你有一個很清晰的使用場景,使用者的回報能夠形成反哺,讓你不斷打磨你的行業大模型,讓解題的準确率,一步一步提高。”
在湯道生看來,大模型的産業應用不一定是天馬行空的場景,但是樸實和有用的,能夠更快解答客戶的疑問。面對百模大戰的競争格局,騰訊的路徑是,基于自身的業務場景去構造産品、打磨産品,達到滿意的效果後把産品開放給行業客戶。
對于大模型優先落地的場景,湯道生向南都記者表示,從文生文場景來看,目前大語言模型應用最廣泛的是溝通和交流的場景,可以實作降本增效或提高使用者體驗,比如客服、售後等,跟使用者打交道多的場景,大語言模型能發揮價值的地方更多。而文生圖能力的高頻使用場景為廣告投放和市場營銷,“我們會針對性地篩選一些行業出來,看哪些行業更願意去使用文生圖等AIGC的能力,來提高他們的投放效率。”
除了通用大語言模型外,騰訊在6月份推出了“騰訊雲MaaS服務”,企業可以在騰訊雲智能大模型精選商店中,選擇混元、開源大模型,或者覆寫金融、醫療、文旅、能源等20多個行業的行業大模型作為底座,借助騰訊雲智能的TI平台,導入企業獨有的專業文檔與企業資料做進一步的訓練與精調,快速生成更有針對性的專屬大模型。
采寫:南都記者 馬甯甯