天天看點

有了行業大模型,騰訊為何還要推出通用大模型?

9月7日,騰訊通用大模型“混元”在2023騰訊全球數字生态大會上正式對外亮相。現場,騰訊高管示範了混元大模型功能,已接入混雲大模型的有騰訊雲、騰訊廣告、騰訊遊戲等50個業務和産品。

有了行業大模型,騰訊為何還要推出通用大模型?

生态大會期間,騰訊集團副總裁蔣傑也接受了南方+記者的采訪,就騰訊通用大模型的發展政策、商業路徑等進行了解答。

談應用:

在騰訊内部成為業務“磨刀石”

南方+:6月時騰訊雲釋出了行業大模型;混元大模型不僅在B端,還有很多C端應用場景。騰訊在整個大模型生态中的定位是怎樣的?

蔣傑:騰訊在6月份先釋出行業大模型,如今通用大模型正式對外亮相。其實在6月時,行業和客戶就有很多關于大模型的需求,而通用大模型,除了能夠支援行業已有的釋出的幾個行業以外,還會支援更多領域,也将作為騰訊雲MaaS服務的底座,進一步服務客戶。

在這幾個月以來,我們一直在和騰訊内部的應用做磨煉,把騰訊重要的、豐富的業務場景當成“磨刀石”,再出來服務更多企業。比如在會議、文檔的應用中,都是在一個複雜的環境之下,通過内部充分打磨,讓我們對自己有信心,這是最關鍵的。我們希望能夠讓騰訊混元大模型成為“倍增器”。

南方+:通過大模型應用,你們希望起到怎樣的作用?

蔣傑:騰訊會議、騰訊文檔、騰訊廣告等已經接入混元大模型,都有很大的使用者量,并得到了深度應用。首先,我們做這個模型,一定是服務企業本身,再通過騰訊雲對外服務客戶和生态合作夥伴。對一個通用大模型來說,它的邏輯思維、推理能力是非常關鍵的。不光要具備複雜的推理能力,甚至對複雜推理能力過程中的安全問題也要有更好判斷。我們希望大語言模型真正能夠給我們生活帶來便利、工作帶來高效。

南方+:大模型的訓練和存儲過程中涉及到大量的個人資料和敏感資料,騰訊是如何保證這些資料的安全和隐私,避免資料的洩露和濫用?

蔣傑:這是一個隐私保護的問題,其實和大模型本身沒有直接聯系。無論有沒有大模型,騰訊都嚴格遵循法律要求,不光是我們做小模型、大模型甚至大語言模型,都不會使用個人隐私資料。此外,騰訊的内容産品,也為騰訊混元大模型提供了大規模、高品質、多樣化的語料庫,能夠學習到各類應用場景中豐富的語言知識和語境了解能力。

談商業化:

從自用到位客戶提供定制化方案

南方+:如何看待大模型的商業化問題?

蔣傑:大模型面向TO B短期會産生很好的商業收入,我認為這還有待探索,因為大模型的成熟度和應對複雜任務的處理能力還不夠,它還有很多嚴肅場景、專業場景,還不能解鎖的時候,其實它的應用場景還是非常有限,需要我們企業甚至業界各個團隊甚至學術界一起完善。騰訊的混元大模型體系,一開始就是根據騰訊企業自身的應用去做的研發,再和大模型更深度結合應用,才能夠去抵消整個大模型高昂的裝置、訓練、人員的成本。

南方+:在商業化上是否有比較清晰的路徑?

蔣傑:我覺得首先是做好技術本身,回歸技術本質,至于商業化,我們會把混元大模型所有能力開放給騰訊所有業務,内部都是公開,都在騰訊的機器學習平台上使用并疊代應用。比如和騰訊文檔、騰訊會議合作,都是和各個業務做深度結合來做對外釋出,混元大模型還要做更多的資料标注、更多的架構、訓練更多的資料。在我們内部,其實可以把混元看作一個在内部開源的模型,每一個公司的内部業務都可以看到混元的能力,他們基于這個能力做應用;面向TO B端則會通過騰訊雲API對外開放。未來,如果每個行業需要做深度定制,騰訊雲也會為大家提供服務。

談自研:

對技術完全掌握才能更好疊代

蔣傑:為什麼要做全鍊路自研?其實也有很多的開源模型,借助很多開源模型就可以在上面做一些疊加,但是,如果不從頭做自研,其實也不會對技術完全掌握,比如說這個模型别人訓練好了,但是有一些違法有害資訊存在的時候,回答是錯誤的,你也沒法在其中做更多的修改,同時,疊代、研發能更快,還有更适合未來騰訊的技術棧的融入。

騰訊從高速網絡、最底層的伺服器到網卡、高速組網,以及平台、模型、算法都是自研的,這種自研其實給我們後續的疊代,是可以加快的。同時,還和其他業務深度結合也會加快。可以這麼說,騰訊有一個海量高并發的業務,開源的很多架構是不适應騰訊的業務體量,是以我們一定要走出一套基于自主體系的研發道路,才能應對海量高并發的業務沖擊式。

南方+:成本和效果上會給客戶帶來哪些優化?

蔣傑:現在大模型的成本其實還是騰訊自己來扛掉,是以成本一定是高昂的,但是我們希望不斷降成本,從訓練的效率和架構上降成本,在服務使用者的推理階段中降成本,未來我們也會做一些定制化方式來讓客戶的成本降到最低。

南方+:整個研發過程中,面臨的技術挑戰主要有什麼?

蔣傑:其實從2021年開始研發,今天我們所看到的結果不是一下子就有的。首先,它要做底層訓練的架構,否則也裝不下千億級參數、2萬億tokens的能力。整個體系在平台架構、模型、算法都是自研的。我們最早不是一個稠密的大模型,而是基于稀疏的大模型,廣告業務做到了一個稀疏大模型來支撐廣告業務。這個過程中騰訊一直在不斷加大投入這些技術能力。最近的研發也在做一些更有深度的能力演進,不但在工業界,也會在學術界提升應用實踐能力。

南方+記者 郜小平

【作者】 郜小平

【來源】 南方報業傳媒集團南方+用戶端