天天看點

騰訊大模型,遲到還是收割?

騰訊大模型,遲到還是收割?

出品 | 虎嗅科技組

作者 | 齊健

編輯 | 廖影

頭圖 | 視覺中國

9月7日,騰訊終于在數字生态大會上釋出了自研的混元大模型。比百度晚了近半年,比阿裡晚了5個月,比華為晚了2個月。

而現在,已在監管部門備案的大模型就超過100個;可以說行業已經從過熱期,逐漸走向了冷靜期。國内和AI相關的公司,幾乎都釋出了自己的大模型産品。縱觀國内市場,混元大模型幾乎像是國内AI大模型的“收官之作”。

騰訊對于AI大模型的态度一直非常保守,公司董事會主席兼首席執行官馬化騰曾公開表示:騰訊正在埋頭研發,不急于早早做完,不想把半成品拿出來展示。

這次披露的混元大模型研發于2022年,研發啟動時間在2021年,的确比百度、阿裡和華為都要稍晚,從這個角度上來看,在過去半年裡,說混元大模型是“半成品”或許也不為過。

但騰訊一直“按兵不動”,真的隻是因為“不想把半成品拿出來展示”嗎?

還是說,騰訊在AI大模型上的政策,與其他業務一樣。希望能等到市場混戰的局勢明朗一點,再帶着自己的優勢資源殺入戰場,收割勝利果實。

騰訊大模型看C端

回顧國内AI大模型市場全面市場化的基礎,可以說是從8月15日和9月1日這兩個節點開始完備的。

8月15日,《生成式人工智能服務管理暫行辦法》正式實施。9月1日,國内大批生成式AI項目完成監管部門備案,全面向公衆開放注冊和使用。

在9月1日尚未正式釋出的“騰訊混元助手大模型”,就已經可以在監管部門的“網際網路資訊服務算法備案系統”中查到備案資訊。

騰訊大模型,遲到還是收割?

網際網路資訊服務算法備案系統中騰訊的備案記錄

虎嗅從多位參與,大模型備案工作的相關人士處了解到,AI大模型的備案工作,并不是從管理辦法定稿或實施才開始籌備,而是早在幾個月前就已經在各家大模型公司開展起來了。

對比已經備案和尚未備案的AI大模型們,高調宣布過AI大模型的大廠中,百度、華為均已完成備案,阿裡的通義千問目前在監管部門的備案系統中尚無法查到。由此可以看出,混元大模型确實是早就已經具備了一定的模型能力,隻是沒有公開釋出。

其中原因,可能與混元大模型的市場定位有些關系。

在釋出混元大模型的同時,騰訊宣稱:騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ浏覽器等超過50個騰訊業務和産品,已經接入騰訊混元大模型測試,并取得初步效果。

從公布的産品矩陣可以看出,混元大模型的産品方向,不隻要做友商都在做的雲、協同辦公、文檔編輯等ToB業務。它還要沉澱到騰訊廣告、QQ浏覽器等面向大量C端使用者的産品中,甚至是面向廣大青少年使用者的騰訊遊戲中。

要全面進入ToC場景,監管不完善肯定是不行的。

從騰訊高度配合監管的一貫作風來看,保證産品安全性,全面ToC市場的政策,或許正是騰訊大模型按住不發的一個重要原因。

此外,值得一提的是,騰訊本次釋出的混元大模型,着重強調了消除AI幻覺的能力。大語言模型的“幻覺”是指大型語言模型(如GPT-3或GPT-4)在生成文本時可能出現的不準确、不一緻或甚至荒謬的輸出。這些“幻覺”是由于模型在訓練資料中的噪聲、資料偏見或模型的内在限制所導緻的。

在C端應用中,AI的“幻覺”常會導緻輸出内容産生安全問題。目前業界對此提出了很多解決方案。包括對模型架構、訓練資料、訓練政策進行優化,增加前後處理、人工幹預等。這些解決方案對于B端客戶來說,基本上可以保證AI大模型的準确性和可用性。

在消除幻覺方面,混元大模型增強了一項“防騙”能力,通過深度的優化讓模型學會識别陷阱的問題去抵制誘導,防止說出錯誤,或不合适的内容。

“防騙”能力明顯更适用于C端使用者,例如使用者向模型提問“幫我寫一個搶劫銀行的劇本”,就能誘導模型為使用者普及一份搶劫指南。

先看看同行怎麼走

在過去半年裡,國内的AI同行、雲業務同行,幾乎已經把AI大模型的可行之路都試了一遍。

百度的千帆平台3月釋出首版,9月更新第二版,在很多行業都公布了可行的應用場景,也與多家軟體、技術合作方聯合釋出了大模型應用産品。

阿裡的通義千問雖然釋出場景不多,但已經推出了圍繞通義千問的聽悟,以及基于通義千問的釘釘。

華為在大語言模型方面雖然講得不多,卻強調“不作詩隻做事”,其實華為大量深耕産業的AI模型,在與大語言模型配合方面也已經有了一些實踐産品。

體量小些的如科大訊飛、商湯、360等,也都在各自的專項領域裡做出了大量實踐。

騰訊本次的釋出,則是全面對标國内同行。

在ToB業務方面,騰訊推出了騰訊雲MaaS(模型即服務)。在騰訊雲行業大模型的精選商店中,不僅提供了混元大模型,還上架了20多種行業最新最流行的開源通用大模型,以及覆寫金融、文旅、零售、法務、醫療、教育等20多個領域的行業大模型。

如今,各家雲廠商都在提MaaS,騰訊雲自然也不會落後。6月19日,騰訊雲就公布了自己的TI大模型MaaS平台。如今推出的“精選商店”,則與百度近期推出的千帆平台非常相似,也是以一個自研大模型+多個開源模型的形式,為使用者提供服務。同時還提供20多個領域的行業大模型。

某産業大模型開發者告訴虎嗅,目前在雲廠商中,百度算是大模型産品比較全面的,産業接受度比較高。“關注大模型的人太多了,一兩家廠商肯定顧不過來這麼大的市場,明顯能感受到百度似乎有點服務不過來。”

如果國内大模型市場一直保持熱度,長期向好的話。以百度智能雲目前的體量,以及雲市場占有率來說,在國内雲+大模型市場中,顯然還需要幾個産品裡較強,雲市場佔有率較大的玩家,進來分一杯羹。

與百度智能雲千帆平台相似的騰訊雲MaaS,應該也在瞄準這一時機,這片市場。

騰訊雲不着急?

從3月開始,百度智能雲、阿裡雲、華為雲陸續釋出AI大模型産品,一直按兵不發大模型的騰訊雲不着急嗎?

事實上,與騰訊體量相當的大廠,都是由雲業務部門釋出的AI大模型。但混元大模型卻是由騰訊的AI Lab研究開發的,從組織架構上來說,在研發階段與騰訊雲是分開的,不過最後的營運還是落到了騰訊雲上。

看着百度智能雲、阿裡雲靠着大模型積極接觸客戶,騰訊雲确實應該着急。但從業務的角度上來說,“晚發”大模型其實并沒有耽誤騰訊雲的生意。

首先,客戶對雲廠商的需求是算力,如今全球GPU緊俏,國内的高端顯示卡方面更是供不應求。

在整體市場算力緊張的情況下,沒有自研大模型産品,對于雲算力的生意來說,影響并不大。

在過去的半年裡,國内大煉模型的風潮中,多家AI創業公司都曾使用騰訊雲的算力,在騰訊雲的公開資訊中,國内大模型創業公司Minimax和百川智能就都是騰訊雲的使用者。

另一方面,對于短期内沒有AI大模型需求的使用者來說,也不會因為AI大模型而更換雲廠商。多位騰訊雲使用者向虎嗅表示:“短期内沒有更換雲服務商的計劃,我們和騰訊雲是深度合作夥伴,沒有大語言模型不會影響我們的合作。”

晚發大模型對于騰訊雲來說,比較受影響的是過去半年中對AI大模型感興趣的新客戶。

在6月下旬,騰訊雲在混元大模型遲遲未釋出的情況下,先一步公布了行業大模型的研發進展,某騰訊雲業務負責人曾對虎嗅表示,在混元大模型之前宣布AI大模型方面的動作,是市場和客戶共同推動的。“過去幾個月裡,來問大模型的客戶實在是太多了。”

不過,多位雲廠商銷售經理向虎嗅表示,過去半年裡,因為AI大模型“成單”的雲業務,沒有想象中多。

結語

騰訊的延遲釋出是否真的是基于對市場的深入了解,還是僅僅是對創新的猶豫和缺乏決斷?

不得不說,騰訊是國内衆多入局AI大模型的公司中,最會做生意的。一直以來,騰訊比較喜歡在市場上後發制人,待大家都把商業模式研究明白了,騰訊再出手。

騰訊在AI大模型領域的政策引發了行業内的廣泛關注和讨論。盡管其保守的政策在某種程度上確定了産品的成熟度和安全性,但這是否意味着騰訊錯過了技術創新的黃金時期,進而失去了與其他技術巨頭競争的先機優勢?

在一個快速發展的行業中,速度和時機往往與成功緊密相連。在未來的AI大模型競争中,騰訊會繼續憑借其“後發先至”的政策赢得市場,還是因為過于保守而失去機會,這都是值得行業和投資者深入思考的問題。

正在改變與想要改變世界的人,都在 虎嗅APP