天天看點

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

作者:智東西
騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

作者 | 香草

編輯 | 李水青

智東西5月17日報道,今日,騰訊雲公布了一系列生成式AI研發、産品進展。騰訊混元大模型全面更新,最高拓展至萬億參數規模,總體性能相比上一代提升50%。同時在多模态能力方面,騰訊雲開源中文原生DiT架構文生圖模型,混元支援單圖可30s生成3D模型,視訊生成時長達到16s。

基于自研混元大模型底座,騰訊雲打造大模型時代原生工具鍊,釋出三大AI引擎工具:大模型知識引擎、圖像創作引擎以及視訊創作引擎。此外,騰訊雲還推出一站式AI智能體創作與分發開放平台——騰訊元器,使用者可以在平台上建立專屬AI智能體,并釋出到QQ、微信等騰訊生态上。

據透露,騰訊雲将于本月底5月30日上線混元大模型App“騰訊元寶”,提供混元及搜尋引擎驅動的高效資訊整合工具。在備受關注的文生視訊方向,混元正在基于ST-DiT全面更新架構,預計到第三季度實作30秒的視訊生成時長,并且在2-3個月内将開放文生視訊API接口。

騰訊集團進階執行副總裁、雲與智慧産業事業群CEO湯道生強調,騰訊始終以“産業實用”,作為發展大模型的核心戰略,通過打造高性能的模型、高效率的工具平台、高靈活的場景應用、高可用的算力基礎設施,以及強安全的模型環境,建構離産業最近的AI。

釋出會後,智東西等少數媒體與騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人、騰訊企點負責人吳運聲進行了深入交談。

談及本周OpenAI、谷歌釋出的語音助手有什麼樣的商業或應用價值,吳運聲認為,其中将視覺、音頻、文本三種模态真正融合在一起,并做到端到端輸入輸出的技術值得關注,将成為未來技術發展的主要趨勢,有很大的商業化前景。

騰訊元器試用申請位址:

https://open.hunyuan.tencent.com

騰訊雲官網位址:

https://cloud.tencent.com/product/hunyuan

一、萬億參數MoE,單圖30s可生成3D模型,視訊生成時長達到16s

騰訊集團副總裁蔣傑蔣傑談道,混元已實作從算力、平台等基礎設施,到生文、生圖、生視訊、生3D等模型建構的全面布局。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元從基礎設施到模型建構的布局

騰訊去年釋出混元大模型,經過多次疊代更新,文本生成基座模型已拓展至萬億參數規模,采用MoE(混合專家模型)結構,最高支援256k上下文,總體性能相比上一代提升50%。

目前,混元已推出Pro、Standard、Lite三個版本,分别對應萬億、千億、百億參數,并通過騰訊雲平台提供給開發者和企業使用者使用。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元拓展至萬億MoE模型

在文生圖方面,混元文生圖基礎架構全面更新,由傳統的U-Net更新為DiT架構,參數量提升十幾倍,測評結果在國内領先。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元文生圖架構更新

除了生成高品質、多風格的圖檔之外,混元還更新了多輪對話能力,使用者可通過自然語言互動,在已生成圖檔的基礎上進行二次編輯。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元文生圖多輪對話能力

在商用層面,混元可高效合成商品素材,例如給商品圖檔更換不同背景,目前已在廣告場景投産。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元文生圖可高效合成商品素材

此外,混元大模型已開始布局文生、圖生3D,據蔣傑透露,單圖輸入僅需30秒即可生成動漫、汽車、建築等類型的3D模型。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元布局3D生成

在視訊生成方面,騰訊混元擁有文生視訊、圖生視訊、圖文生視訊、視訊生視訊4大核心能力,支援視訊風格化、視訊重繪等多樣化的産品玩法,相比Pika、Runway等友商分辨率更高、運動幅度更大,最長可以生成16s視訊。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元生視訊4大核心能力

蔣傑透露,混元正在基于ST-DiT全面更新架構,預計到第三季度實作30秒的視訊生成,并且在2-3個月内将開放文生視訊API接口。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元文生視訊能力

二、推一站式Agent創作分發平台,月底将上線“騰訊元寶”App

基于混元大模型能力,騰訊于本周二(5月14日)全面開源了DiT架構文生圖模型。這是業内首個中文原生的DiT架構文生圖開源模型,支援中英文雙語輸入及了解,參數量15億。

跟其他業界開源模型對比,混元DiT在多個次元上無短闆,其綜合名額在所有開源和閉源算法中排名第三,實作開源版本中的SOTA。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元中文原生DiT架構文生圖模型開源

今日騰訊雲宣布,後續将開源三個尺寸文生文MoE模型,包括面向手機端部署的Hunyuan-S、面向PC端部署的Hunyuan-M以及面向雲/資料中心部署的Hunyuan-L,參數規模從30億到300億不等。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元即将開源多種尺寸MoE模型

此外騰訊雲全面開啟智能體生态,推出一站式AI智能體創作與分發開放平台“騰訊元器”,使用者不僅可以在平台上建立專屬AI智能體,使用騰訊官方的插件和知識庫,還能将這些智能體并釋出到QQ、微信或App上。

騰訊元器即日起開放申請體驗,具有低門檻建立智能體、豐富的插件和知識庫、打通騰訊全域分發通路等優勢。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲一站式AI智能體創作與分發開放平台騰訊元器

基于混元大模型能力,騰訊雲将于月底5月30日正式上線騰訊元寶App,旨在高效搜尋和提煉資訊,為使用者提供混元及搜尋引擎驅動的高效資訊整合工具,以及結合騰訊内容生态提供有趣實用的生活功能。

蔣傑稱,騰訊元寶在互動方面較為簡潔,隻有一個輸入框,通過這個入口可以實作AI搜尋、文檔總結、翻譯官、口語陪練等功能。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲騰訊元寶App即将上線

三、三大引擎降低模型落地門檻,5分鐘開發企業級知識應用

騰訊雲副總裁吳運聲談道,以大模型技術為核心,AI已成為數字化發展的關鍵動力。據Gartner機構釋出的《生成式AI産業落地路徑研究報告》,中國10億參數規模以上的大模型數量已超過100個,超過60%的中國企業都計劃在未來12-24個月部署生成式AI。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲AI成為數字化發展關鍵動力

但要加速大模型産業創新,大模型廠商還需要解決三大挑戰:降低工具使用門檻、提高平台适配性、安全合規保障。

為了應對這些挑戰,騰訊雲全新推出大模型時代原生工具鍊,包括“大模型知識引擎”、“大模型圖像創作引擎”和“大模型視訊創作引擎”三款PaaS工具,助力企業在知識服務、圖像和視訊創作場景提質提效。

針對知識管理場景,騰訊雲推出大模型知識引擎,讓AI不僅懂“産業”,更懂“企業”和“産品”。

知識引擎是聚焦企業知識服務場景的大模型應用開發平台,以大模型+RAG(檢索增強生成)為架構打造。利用自然語言,企業使用者5分鐘就可以開發出一款知識服務應用,快速在客服營銷、企業知識社群等業務場景落地。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲大模型知識引擎

背後的騰訊雲OCR解析大模型,将“知識解析”的準确率提升25%。通過語義級知識切分、資料向量化,大模型能快速檢索到最比對的答案,大幅度降低幻覺,回答更可靠。

大模型圖像創作引擎提供AI圖像生成與處理能力的API技術服務,可以結合輸入的文本或圖檔智能創作出與輸入相關的圖像内容,支援圖像風格化、AI寫真、線稿生圖等能力。

大模型視訊創作引擎基于騰訊視訊生成大模型等一系列音視訊AI技術,支援高品質生成或處理視訊内容,覆寫視訊轉譯、視訊風格化、圖像跳舞、視訊插幀、藝術字視訊、運動筆刷、畫布拓展等能力。

大模型原生工具鍊推動AI普惠的同時,騰訊雲也更新了智能座艙、企點營銷雲AI助手、AI代碼助手等多款大模型産品應用,讓“開箱即用”的AI加速落地産業。

四、已接入内部600+場景,B端、C端雙管齊下

據湯道生透露,混元大模型已接入騰訊内部600多個應用場景。

在C端,近日微信讀書基于混元大模型推出AI問書、AI大綱等新功能,大幅提升使用者的閱讀效率和體驗。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元大模型在C端落地

在B端,騰訊旗下的SaaS協作産品全面接入混元。騰訊客服團隊基于混元大模型更新智能客服體系,獨創智能客服垂直領域精調模型,在智能對話的意圖了解準确性和多輪問答流暢性方面,相比傳統小模型下文準确性提升了38%。

騰訊廣告基于混元推出了一站式AI廣告創意平台騰訊廣告妙思,助力提升廣告生産及投放效率,其中圖生圖平均點選通過率提升15%。

騰訊混元大模型更新!性能提升50%,可生成16s視訊,月底見

▲混元大模型在B端落地

結語:打破AI“落地玻璃”,讓大模型從可見變為可用

大模型技術已逐漸趨于成熟,但從“可見”到“可用”之間,仍有一定的距離。企業該怎麼找到生成式AI落地的最優路徑?從模型、平台、場景應用到算力基礎設施的全鍊路戰略是騰訊雲交出的答卷。

正如湯道生所說,“大模型的打造隻是起點,把技術落地到産業場景,創造價值才是目标”,打造大模型原生工具鍊,助力企業在知識服務、圖像和視訊創作上提質提效,“建構離産業最近的AI”才能讓大模型發揮最大的價值。

繼續閱讀