中國首個音樂SOTA模型「天工音樂大模型」今日公測

2024年4月17日，在「天工」大模型一周年之際，昆侖萬維重磅宣布，「天工3.0」基座大模型與「天工SkyMusic」音樂大模型正式開啟公測！一年前的今天，第一版天工大模型正式對外釋出上線，一年來我們不斷疊代模型，疊代應用産品，模型和應用都越做越好，以此回報廣大使用者的支援。

「天工3.0」擁有4000億參數，超越了3140億參數的Grok-1，是全球最大的開源MoE大模型。「天工3.0」在語義了解、邏輯推理、通用性、泛化性、不确定性知識、學習能力等領域擁有突破性的性能提升，數學/推理/代碼/文創能力提升超過30%。

（天工3.0模型參數超越Grok-1，成全球最大開源MoE專家混合大模型）

強大的模型技術實力賦予「天工3.0」超強的性能表現。在MMBench等多項權威多模态測評結果中，「天工3.0」超越GPT-4V，全球領先。

（天工3.0多模态性能超越GPT-4V，全球領先）

同時，「天工3.0」旗下的「天工SkyMusic」音樂大模型也在今日面向全社會開放公測。「天工SkyMusic」是中國首個音樂SOTA模型，更是中國的自研大模型技術第一次在AIGC領域領跑全球。

（天工SkyMusic綜合性能超越Suno V3，取得音樂大模型SOTA，領跑全球）

天工SkyMusic：中國首個音樂AIGC SOTA模型

此前，大模型已經在文本、圖像等多個技術領域取得突破，帶來産業全面變革。然而，在AI音樂生成領域，全球遲遲等不到一款産品，開啟「音樂ChatGPT時刻」。

這是因為一直以來，AI音樂行業大量研究都集中在符号音樂生成技術路線上，并且大多隻能實作無人聲背景音樂（Background Music，BGM）的生成，音樂的品質、效果、審美都遠遠達不到可用水準，産業遲遲未能爆發。

（「天工SkyMusic」自研AI音樂大模型技術架構）

與行業主流路徑不同，「天工SkyMusic」采用自研大模型音樂音頻生成技術路線。這一路線直接通過大模型技術實作樂器、人聲、旋律、音量、音符的一體化端到端音樂生成，技術難度極大，全球隻有包括昆侖萬維在内的極少數頂尖玩家參與。

在與海外頂尖的AI音樂大模型Suno V3的橫向測評中，「天工SkyMusic」在人聲&BGM音質、人聲自然度、發音可懂度等領域顯著領先對手，并以6.65分的綜合得分超越Suno V3，成為全球AI音樂SOTA模型。

此外，「天工SkyMusic」還擁有獨創的參考音樂生成與方言歌曲生成能力。

參考音樂生成：使用者可上傳自有參考音樂，或選擇「天工SkyMusic」資料庫中現有的參考音樂，進而生成風格、唱腔類似的歌曲，進一步降低音樂大模型的使用門檻，讓不熟悉樂理知識的使用者也能輕松玩轉。

方言歌曲生成：「天工SkyMusic」生成的音樂不僅在人聲自然度、發聲可懂度等領域表現優秀，更能夠支援粵語、成都話、北京話等衆多方言，讓使用者能夠更自由地實作音樂表達，傳播方言文化。

「天工SkyMusic」是中國首個公開可用的AI音樂生成模型，更是中國自研大模型技術第一次在AIGC領域領跑全球。

目前，在文本大模型領域，OpenAI吸引了全球的注意力；但是在AI搜尋、AI音樂生成等細分領域，中國玩家們正在奮勇前行，不斷通過自研技術取得細分領域頂尖的SOTA表現，共同建設中國大模型産業，打造自主可控的大模型産業生态。

天工3.0：4000億參數，全球最大開源MoE大模型

在上一代「天工2.0」MoE大模型的領先基礎上，「天工3.0」實作了全面的性能更新，采用了4000億級參數MoE混合專家模型架構，是目前全球模型參數最大、性能最強的開源MoE模型。

「天工3.0」的邏輯推理能力、語義了解能力、應對複雜需求能力、内容創作能力全面更新，并新增了多輪搜尋與綜合工具調用、圖表繪制、研究模式、增強模式、改圖擴圖等多項AI能力，為使用者帶來全新AI體驗。

多輪搜尋與綜合工具調用：「天工3.0」針對模型獨立規劃、調用、組合外部工具及整合資訊的能力進行了專項訓練，使其能夠獨立生成并調用代碼，完成包括産業研究、産品橫評、資訊分析、圖檔生成、圖表繪制等多種複雜使用者需求。

同時，「天工3.0」能夠通過強大的語義了解能力将使用者任務拆解成細分環節，實時判斷是否需要聯網或調用工具，進行單輪或多輪的聯網搜尋、工具調用，完成包括多輪搜尋、熱點資訊分析、圖檔生成等複雜使用者需求。

（Query：查詢最新中國曆史電影票房排行，圖表展示）

圖表繪制：「天工3.0」全面提高了邏輯推理能力與使用者自然語言Query的了解能力，使其能夠更精準地判斷使用者需求，獨立生成并調用代碼，結合文本需求實時進行内容分析及圖表建構，為使用者帶來更直覺、高效的對比結果。

（Query：北京、上海、重慶哪個好玩？）

多輪搜尋、綜合工具調用、圖表繪制等都是「天工3.0」所獨有的大模型綜合能力，其從底層打通了「天工3.0」的AI搜尋、AI對話、AI代碼生成、AI圖檔識别、AI圖像生成等底層能力，通過語義識别能力直接觸發，為使用者帶來更加便捷、高效的AI體驗，成為真正的AI生産力工具。

此外，「天工3.0」中還增加了研究模式、增強模式、改圖擴圖等多項AI能力。

研究模式：在研究模式中，「天工3.0」能夠圍繞使用者的某個簡單指令進行相關問題的延伸，自動生成研究大綱、圖譜、實踐總結、思維導圖，幫助使用者快速清晰地把握核心内容，完成使用者複雜的研究需求。

（Query：康乾盛世年代）

增強模式：在增強模式中，「天工3.0」能夠針對使用者的複雜Query進行拆解、細化、并進行追問、資訊了解與補全，使其在自然語義了解方面性能更強，面對不确定性知識時表現更好，能夠更精準、高效地滿足使用者需求。

（Query：2024年春節檔電影；「天工3.0」了解并追問使用者需求）

改圖擴圖：「天工3.0」多模态性能取得全面突破，超越GPT-4V，綜合排名全球第一。在強大的技術底座支援下，「天工3.0」的AI繪圖能力新增了圖檔尺寸擴充、圖檔定向調整、墊圖生圖、墊圖進化、墊圖擴圖等全新功能。

（「天工3.0」的AI改圖、修圖、擴圖等功能）

中國首個音樂SOTA模型「天工音樂大模型」今日公測

繼續閱讀

第三艘航母的海試，标志中國邁入新的裡程碑

中國堅決拒絕！美國試圖複制亞洲金融風暴，解決35萬億美債危機

中國十大富婆，看了好羨慕，趕緊努力

肝膽虛弱首選二至丸，肝腎同源，這是中國人補肝的秘寶

中國女籃今天公布最新17人名單！李夢、張茹領銜，李月汝海外回歸

生态環境部黨組書記孫金龍在《學習時報》發表署名文章《以美麗中國建設全面推進人與自然和諧共生的現代化》

華為重要人事變動！餘承東卸任華為終端BG CEO，曾帶領華為手機重奪中國市場第一【附智能手機行業現狀分析】

應對少子化！日本或将進入單身稅時代！通過征收兒童支援金支援有孩家庭【附中國人口現狀分析】

加強創新科技和産業資源對接共探“AI+”産業發展新未來丨2024創新中國研讨會在楊浦舉行

懷來音樂噴泉5月開放時間表新鮮出爐！

50年代中國珍貴老照片：批鬥現場地主面若死灰，美女穿旗袍殺豬

緻敬勞動者！《中國夢·勞動美——2024五一國際勞動節“心連心”特别節目》今晚播出

【繪畫作品征集】“零碳中國·美麗家園”少年繪畫作品征集通知

20元就能買1杯，“沒興趣打價格戰”的星巴克，也打折了？中國會員數已超1.27億，然而……

張作義與中國核能：願盡一生力量換人類幸福

中國兒童咳嗽診治指南來了！執筆專家線上解讀（2023基層版）