天天看點

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

作者:小安然看世界

閱讀文章前,麻煩您點選一下“關注”,友善讨論和分享,小編将持續更新,感謝您的支援

導語:

在2023年的騰訊全球數字生态大會上,騰訊混元大模型閃亮登場,宣布正式向外界敞開大門。這款強大的通用大語言模型,不僅擁有超千億參數規模和強大的中文創作能力,還具備複雜語境下的邏輯推理能力以及可靠的任務執行能力。但令人矚目的是,騰訊混元大模型注重實用性,已經在超過50個騰訊業務和産品中投入測試,并取得初步成果。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

本文将深入探讨這一創新,以及騰訊在大模型領域的全鍊路自研技術,以提高模型的可靠性和成熟度,推動人工智能在各個領域的實際應用。

深入全鍊路自研技術

騰訊混元大模型的誕生并非一蹴而就,它從零開始進行了全鍊路自研技術的訓練,涵蓋了模型算法、機器學習架構以及AI基礎設施等多個領域。這一自研技術的發展曆程自2021年始,騰訊率先推出千億和萬億參數的NLP稀疏大模型,成功打破了CLUE三大榜單記錄,實作了中文了解能力的新突破。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

然而,盡管業界大模型呈現出強大的潛力,但在實際應用中的應用仍然受到限制,主要集中在容錯率高、任務簡單的休閑場景。為了提高模型的可靠性和成熟度,騰訊在算法層面進行了一系列自研創新。

為了解決大模型容易“胡言亂語”的問題,騰訊對預訓練算法和政策進行了優化,使混元大模型的表現相比主流開源大模型降低了30%至50%。通過強化學習方法,模型學會了識别陷阱問題,并且通過位置編碼的優化,提高了處理超長文本的效果和性能。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

騰訊還提出了思維鍊的新政策,使大模型能夠像人一樣結合實際應用場景進行推理和決策。

此外,騰訊還自研了機器學習架構Angel,大大提高了訓練速度和推理速度,使混元大模型更加高效。

全鍊路自研技術的優勢

騰訊混元大模型的全鍊路自研技術賦予了它許多強大的能力。它可以了解上下文的含義,并且具備長文記憶能力,能夠進行專業領域的多輪對話,實作流暢的溝通。此外,它還可以進行文學創作、文本摘要、角色扮演等内容創作,能夠充分了解使用者的意圖,并快速、準确地給出有時效性的答複。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

混元大模型在中國信通院的标準符合性測試中表現出色,在模型開發和模型能力方面獲得了目前最高分。在主流的評測集上,混元大模型也表現出色,特别是在中文的理科、聯考題和數學等子項上表現突出。

上海财經大學校長劉元春表示,騰訊的全鍊路自研技術将有助于中國積累大模型相關的人才和技術,逐漸形成體系化的産業鍊、人才鍊、技術鍊和創新鍊,為通用人工智能的發展提供堅實支撐。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

全面擁抱大模型的願景

騰訊混元大模型的推出并不僅僅是為了在評測上獲得高分,而是将這一技術應用到實際場景中。騰訊将全面擁抱大模型,并已經在多個業務中實際應用混元大模型。

例如,在騰訊會議中,基于混元大模型打造了AI小助手,使用者隻需用自然語言進行簡單指令,就能完成複雜的會議資訊提取和内容分析任務,會後還能生成智能總結紀要,這一功能受到使用者的高度認可。

在文檔處理方面,混元大模型支援多種文本創作場景,已經應用在騰訊文檔的智能助手功能中。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

此外,混元還能夠一鍵生成标準格式文本,精通數百種Excel公式,支援自然語言生成函數,并基于表格内容生成圖表,這些功能目前正在内測中,未來将面向使用者開放。

在廣告業務場景中,騰訊混元大模型支援智能化的廣告素材創作,能夠适應不同行業和地域特色,實作文字、圖檔和視訊的自然融合。此外,基于混元大模型的能力,廣告智能導購

能夠在企業微信等場景中幫助商家提升服務品質和效率,為使用者提供更加個性化的體驗。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

今年6月,騰訊雲推出了模型即服務解決方案,為客戶提供了一站式的行業大模型服務,包括模型預訓練、模型精調、智能應用開發等。騰訊雲也積極接入了20多個主流模型,像混元一樣支援直接部署和調用,使客戶可以根據實際需求,選擇基于混元或其他開源模型,建構适合自己的行業大模型。

這一全面擁抱大模型的願景正是騰訊的發展方向,他們不僅關注模型的性能,更關心将技術應用到實際場景中,為使用者提供更加智能化的服務和體驗。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

總結

騰訊混元大模型的亮相标志着中國在大模型領域取得了重要突破,不僅在模型規模上有了顯著進展,還在全鍊路自研技術上進行了創新,提高了模型的可靠性和成熟度。這一技術的廣泛應用将為各個行業帶來更多可能性,提升了人工智能在數字化發展中的關鍵地位。

騰訊的全面擁抱大模型戰略也彰顯了他們對技術創新和使用者體驗的承諾。通過将混元大模型應用于多個業務場景,騰訊展示了大模型不僅是評測的高分利器,更是實際應用的有力工具。

騰訊自研混元大模型正式亮相,通過騰訊雲對外開放

繼續閱讀