天天看點

騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

作者:IT之家

IT之家 10 月 26 日消息,據“鵝廠技術派”消息,騰訊混元大模型近日迎來全新更新,并正式對外開放“文生圖”功能。官方宣稱,更新後的騰訊混元中文效果整體超過 GPT3.5,代碼能力大幅提升 20%,達到業界領先水準。

騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

▲ 圖源鵝廠技術派公衆号

據介紹,大模型文生圖的難點展現在對提示詞的語義了解,生成内容的合理性以及生成圖檔的效果,針對這三個技術難點,騰訊進行了專項的技術研究,提出了一系列原創算法:

  • 在語義了解方面,騰訊混元采用了中英文雙語細粒度的模型,模型同時模組化中英文實作雙語了解,而不是通過翻譯,通過優化算法提升了模型對細節的感覺能力與生成效果,有效避免多文化差異下的了解錯誤。
  • 在内容合理性方面,AI 生成人體結構和手部經常容易變形。混元文生圖通過增強算法模型的圖像二維空間位置感覺能力,并将人體骨架和人手結構等先驗資訊引入到生成過程中,讓生成的圖像結構更合理,減少錯誤率。
  • 在畫面質感方面,混元文生圖基于多模型融合的方法,提升生成質感。經過模型算法的優化之後,混元文生圖的人像模型,包含發絲、皺紋等細節的效果提升了 30%,場景模型,包含草木、波紋等細節的效果提升了 25%。
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

▲ 圖源鵝廠技術派公衆号

如果使用者想生成一張更接近真人感的照片,或接近實拍的圖檔,可以加上“真實感”或“攝影風”等描述;如果使用者想要特定風格的圖檔,建議在提示詞中加入該風格的描述,如油畫風、賽博朋克風等。此外,使用者還可以對畫面進行盡可能詳細地描述,以獲得滿意的效果。

據介紹,騰訊内部目前已經有多個開發平台接入了騰訊混元大模型,已有超過 180 個内部業務接入混元,包括騰訊會議、騰訊文檔、企業微信、騰訊廣告和微信搜一搜等。

騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

▲ 圖源IT之家網友

近日,有IT之家網友回報已經通過混元大模型内測稽核,并分享了相關操作頁面。從截圖中可以看到,混元大模型支援制定面試大綱、旅行計劃、PPT 大綱、健身計劃等功能,分為工作、程式設計、營銷、生活等選項。

此外,混元大模型還支援 AI 對話功能,已經通過的内測申請的使用者可以嘗鮮一下。

IT之家附更多生成圖:

騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

▲ 圖源鵝廠技術派公衆号,下同

騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放
騰訊混元大模型現已支援“文生圖”功能,将陸續向使用者開放

繼續閱讀