天天看點

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

作者:替代視訊共享細菌

繼OpenAI和谷歌接連深夜炸場,位元組把大模型的價格打下來後,騰訊也迫不及待秀出了肌肉。

5月17日,在騰訊雲生成式AI産業應用峰會上,騰訊公布了一系列産品研發進展:

騰訊混元大模型能力持續更新,三大版本将面向産業客戶和個人開發者全面開放接入;

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

騰訊一站式AI智能體創作與分發平台“騰訊元器”正式釋出,即日起開放申請體驗;

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

騰訊混元大模型面向個人的助手App“騰訊元寶”将于5月30日釋出;

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

騰訊雲推出大模型原生工具鍊,三大引擎工具助力企業高效開發AI應用。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

此外,面向企業客戶和開發者,騰訊還釋出了多款開箱即用的SaaS産品,騰訊雲TI平台、向量資料庫等AI開發工程能力也全面更新。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

騰訊元寶+元器,

AI搜尋和智能體全拿下

此前,騰訊混元助手隻能在微信小程式或網站(https://hunyuan.tencent.com/bot)上使用,很快手機端App也要上線了。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

在本次大會上,騰訊宣布将于5月30日推出混元大模型面向個人的助手App“騰訊元寶”。

據介紹,這是一個基于混元大模型及搜尋引擎驅動的高效資訊整合工具,界面設計簡潔,可以搜尋實時資訊,可以對上傳的多格式文檔進行總結、翻譯,也可以語音對話練習口語。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

看來AI搜尋大戰即将迎來一位重磅選手,有騰訊内容生态支援的AI助手App,到底表現如何?“頭号AI玩家”後續将跟進評測,歡迎關注。

除了騰訊元寶,騰訊還釋出了另一個名字相呼應的産品“騰訊元器”。

騰訊元器是基于混元大模型的一站式AI智能體創作與分發開放平台,使用者可以通過提示詞、插件、工作流、AI輔助建立等能力,低門檻建立專屬AI智能體。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

同時,騰訊元器預內建了騰訊生态特色插件、知識庫資源,還将開放第三方能力,為創作者提供開箱即用的工具。

建立好的智能體還可以釋出到QQ、微信、騰訊雲等騰訊全域分發管道,優質智能體有機會獲得流量扶持。

可以看到,AI智能體的市場競争激烈,騰訊元器、位元組的扣子、OpenAI的GPTs等智能體平台都在争奪開發者和使用者,期望建構起基于自家大模型的繁榮生态。

即日起騰訊元器可通過官網申請體驗: https://open.hunyuan.tencent.com/my-creation

“頭号AI玩家”在第一時間拿到了内測資格,在智能體商店頁面,共有人物角色、效率工具、休閑娛樂、遊戲消遣、生活助手、情感幫手等6個類别。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

比如問問“高情商Bot”,怎麼禮貌地跟老闆拒絕周末加班?

(以一種溫和而堅定的語氣)老闆,我了解有時候項目緊急需要我們犧牲休息時間來加班。但是,我也相信工作與生活的平衡對于保持工作效率和個人健康都是非常重要的……
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

還可以讓智能體專家解析一下姓名“甄嬛”,從這個回答來看,合理懷疑混元已經偷偷過了10次情關。

“甄嬛”這個名字就像一幅美麗的畫卷,展現了一個既聰明又善良的女性形象。這個名字的主人可能在生活中表現出極高的智慧和情商,能夠在複雜的人際關系中遊刃有餘。
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

想要自己建立一個智能體,操作也很簡單。輸入名稱、簡介就可以AI生成頭像,再借助AI生成詳細設定,包含角色、技能、原則等,右側預覽頁面可以輸入問題進行調試。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

比如我們建立了一個“土味情話bot”,基本拿捏了土味的精髓,文藝中夾雜着油膩。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

在釋出頁面,可以看到騰訊元器支援推送到QQ、微信客服、小程式、公衆号,不過需要經過平台稽核才能向所有人開放。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

混元大模型全面更新,

視訊生成可達16秒

自2023年9月亮相以來,騰訊自研的混元大模型持續疊代更新,率先采用混合專家模型(MoE)結構,推動了性能提升和推理成本下降。據介紹,混元在中文表現尤其是文本生成、數理邏輯和多輪對話上性能表現卓越。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

在文本生成方面,混元提升了“時新”問題的回答表現。比如“秦嶺棕色大熊貓最近一次是什麼時候被拍到”這個問題,混元能準确回答最新的時間,而ChatGPT隻能根據新聞資訊來回答。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

在數學、推理能力上,混元也有大幅提升。比如1、4、5、6這四個數字算24點,ChatGPT用基本的減法和乘法算錯了,而混元運用減法、除法和括号組合計算得出了24。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

而目前大熱的多模态領域,也是騰訊混元正在積極探索的一個方向。

在大會前幾天,騰訊剛剛宣布混元文生圖大模型全面更新并對外開源,其采用了與Sora一緻的DiT架構,不僅可支援文生圖,也可作為視訊等多模态視覺生成的基礎。

騰訊文生圖負責人蘆清林今天在接受媒體群訪時表示,文生圖從Stable Diffusion改成DiT後有更好的擴充性,語義表達能力會更強,可以容納更多的資訊量。

ChatGPT支援通過文字指令對圖檔進一步修改,混元如今也能通過多輪對話對生成的圖檔進行局部修改,比如給圖檔中的兔子戴上一個紅帽子,其主體和背景都能保持基本一緻。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

同時,混元文生圖支援生成高品質的2D、3D遊戲畫面,也可高效合成商品素材,目前已在廣告場景投産,能夠為客戶節省制作成本。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

單圖生成3D模型隻需30秒,在動漫、汽車、建築等産業已有不少應用。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

混元目前還未向C端使用者開放視訊生成能力,據騰訊副總裁、騰訊混元大模型負責人蔣傑介紹,混元生成視訊的分辨率和運動幅度都優于Pika和Runway。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

騰訊混元和清華大學、香港科技大學在今年3月聯合推出圖生視訊模型“Follow-Your-Click”,帶來了新的互動方式。基于輸入模型的圖檔,隻需點選對應區域,加上少量提示詞,就可以讓圖檔中原本靜态的區域動起來,一鍵轉換成視訊。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

混元的下一代視訊模型,正在基于ST-DiT全面更新架構,目前可以生成時長達16秒的視訊,Q3預計可以達到30秒。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

蘆清林提到,現在最大的技術難點在于不同的模态之間是不對齊的,就像視訊和音頻如果想用一個模型同時生成的話會有很大的混淆,騰訊混元團隊正在解決多模态的對齊問題。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

面向開發者開放三大版本,

文生文模型即将開源

開放,是本次大會的關鍵詞之一,圍繞混元大模型,騰訊雲正在做大生成式AI産業生态。

據大模型評測機構SuperCLUE最新釋出的《中文大模型基準測評2024年度4月報告》,騰訊混元大模型位列國内大模型第一梯隊,處于卓越上司者象限。

目前混元已擴充至萬億級參數規模,在基礎的大模型能力上,騰訊混元這次推出了三個靈活的模型規模版本,分别為混元hunyuan-pro、hunyuan-standard、hunyuan-lite,通過騰訊雲面向企業、個人開發者全面開放。

根據不同業務需求,開發者可選擇最适合的模型。其中最大的混元hunyuan-pro是目前混元模型的效果最優版本,上下文長度最高達32k tokens,可用于複雜的文本創作、邏輯推理、數學計算、智能NPC、專業領域等應用場景。

騰訊雲副總裁、騰訊雲智能負責人吳運聲在談到近期行業出現的“價格戰”趨勢時表示,騰訊更關注大模型能力的提升,緻力于為行業提供能力和價格兼具的産品。

在本次大會上,騰訊還宣布将在今年三季度開源混元最核心的文生文模型。

騰訊内部正在訓練三種尺寸(S、M、L)的文生文模型供開源使用,S版主要部署在手機端,擁有3B參數量;M版主要部署在PC端,參數量為5B;L版主要部署在雲/資料中心,是30B參數量的MOE架構模型。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

此外,騰訊雲還推出了三款PaaS産品:“大模型知識引擎”“大模型圖像創作引擎”和“大模型視訊創作引擎”,旨在簡化大模型的應用,推動産業AI的普及。

大模型知識引擎将大模型知識問答能力更新,簡化了資料工程、模型精調和應用開發的流程,提供包括文檔解析、向量檢索和多輪改寫,以提升企業知識問答的準确率和查詢效率。目前,騰訊雲的大模型知識引擎已在政務、金融、教育等多個行業得到應用。

圖像創作引擎提供AI圖像生成與編輯能力的API技術服務,可基于文本或圖檔智能創作圖像内容,包括圖像風格化、AI寫真、商品背景生成和線稿生圖等,以滿足不同行業場景的需求。

視訊創作引擎提供視訊生成和處理能力,支援視訊轉譯、風格化、圖像跳舞、人臉融合等,适用于短視訊平台、影視制作等場景。

目前,混元大模型已在騰訊600多個業務場景中得到應用,并通過公司生态不斷優化。

面向C端使用者的如微信讀書基于混元大模型推出AI問書、AI大綱等新功能,大大提升了使用者的閱讀效率和體驗。騰訊客服則通過模型更新,顯著提高了智能對話的準确性和效率,日處理使用者請求量達150萬次。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家
從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

面向B端的如騰訊廣告的AI創意平台“妙思”借助混元大模型提高了廣告效率,騰訊會議的AI助手也通過模型優化提升了會議效率,其使用量四個月内增長了20倍。

從OpenAI開始的AI爆炸周,現在終于輪到騰訊秀肌肉了|AI玩家

“大模型的打造隻是起點,把技術落地到産業場景,創造價值才是目标。”騰訊集團進階執行副總裁、雲與智慧産業事業群CEO湯道生說道。

繼續閱讀