騰訊混元大模型現已支援“文生圖”功能，将陸續向使用者開放

作者：IT之家 2023-10-26 15:07:00

IT之家 10 月 26 日消息，據“鵝廠技術派”消息，騰訊混元大模型近日迎來全新更新，并正式對外開放“文生圖”功能。官方宣稱，更新後的騰訊混元中文效果整體超過 GPT3.5，代碼能力大幅提升 20%，達到業界領先水準。

▲ 圖源鵝廠技術派公衆号

據介紹，大模型文生圖的難點展現在對提示詞的語義了解，生成内容的合理性以及生成圖檔的效果，針對這三個技術難點，騰訊進行了專項的技術研究，提出了一系列原創算法：

在語義了解方面，騰訊混元采用了中英文雙語細粒度的模型，模型同時模組化中英文實作雙語了解，而不是通過翻譯，通過優化算法提升了模型對細節的感覺能力與生成效果，有效避免多文化差異下的了解錯誤。
在内容合理性方面，AI 生成人體結構和手部經常容易變形。混元文生圖通過增強算法模型的圖像二維空間位置感覺能力，并将人體骨架和人手結構等先驗資訊引入到生成過程中，讓生成的圖像結構更合理，減少錯誤率。
在畫面質感方面，混元文生圖基于多模型融合的方法，提升生成質感。經過模型算法的優化之後，混元文生圖的人像模型，包含發絲、皺紋等細節的效果提升了 30%，場景模型，包含草木、波紋等細節的效果提升了 25%。

▲ 圖源鵝廠技術派公衆号

如果使用者想生成一張更接近真人感的照片，或接近實拍的圖檔，可以加上“真實感”或“攝影風”等描述；如果使用者想要特定風格的圖檔，建議在提示詞中加入該風格的描述，如油畫風、賽博朋克風等。此外，使用者還可以對畫面進行盡可能詳細地描述，以獲得滿意的效果。

據介紹，騰訊内部目前已經有多個開發平台接入了騰訊混元大模型，已有超過 180 個内部業務接入混元，包括騰訊會議、騰訊文檔、企業微信、騰訊廣告和微信搜一搜等。

▲ 圖源IT之家網友

近日，有IT之家網友回報已經通過混元大模型内測稽核，并分享了相關操作頁面。從截圖中可以看到，混元大模型支援制定面試大綱、旅行計劃、PPT 大綱、健身計劃等功能，分為工作、程式設計、營銷、生活等選項。

此外，混元大模型還支援 AI 對話功能，已經通過的内測申請的使用者可以嘗鮮一下。

IT之家附更多生成圖：

▲ 圖源鵝廠技術派公衆号，下同

繼續閱讀