天天看點

All in AGI與AIGC,昆侖萬維成果顯著

作者:子彈财經

2023年,ChatGPT爆火,各大科技企業紛紛宣布研發自身的AI大模型,昆侖萬維也不例外。在2023年4月,昆侖萬維釋出了天工大模型1.0版本。

由于性能較好,天工大模型成為國内排名靠前的通用大模型。經過1年時間發展,天工大模型也在不斷疊代。2024年4月17日,昆侖萬維自研四千億級大語言模型“天工3.0”正式開啟公測并同步開源。

據悉“天工3.0”是目前全球模型參數最大、性能最強的MoE模型之一,相較上一代,“天工3.0”在模型語義了解、邏輯推理等多個性能次元均有明顯提升。與“天工3.0”同步公測的還有昆侖萬維的音樂大模型天工SkyMusic,據悉,天工SkyMusic是中國首個音樂AIGC SOTA模型。

對于昆侖萬維而言,經過多年的嘗試,在原有的主營業務之下,昆侖萬維終于摸索出新的方向。All in AGI與AIGC從來不是一句口号,昆侖萬維正用實際行動證明,公司正在堅定的執行All in AGI與AIGC經營政策。

财報顯示,昆侖萬維2023年研發費用進一步提升至9.7億元,同比增長40.2%。此外,昆侖萬維原有業務發展也較為順暢,2023年公司實作營業收入49.2億元,海外業務收入占比達86.0%,同比提升8.4個百分點;實作歸屬于上市公司股東的淨利潤12.6億元,同比增長9.15%,利潤規模繼續位居行業前列。

昆侖萬維All in AGI與AIGC效果顯著

在接受采訪時,昆侖萬維董事長兼CEO方漢表示,在AI爆火以前,公司曾經曆過多次小規模的創業,直到2023年,昆侖萬維下定決心要All in AGI與AIGC。

方漢表示,從1995年開始,國内網際網路科技大約經曆了三個周期,第一個周期是網際網路,第二個周期是移動網際網路,第三個是目前的AI。

在這三個周期中,企業成功的關鍵便是免費和C端兩個模式疊加。在此背景下,2023年4月昆侖萬維推出了面向C端的“天工大模型”。

經過1年時間的疊代,昆侖萬維大模型已經進化到3.0版本。與“天工2.0”相比,“天工3.0”實作了全面的性能更新,采用了4000億級參數MoE混合專家模型架構,是目前全球模型參數最大、性能最強的開源MoE模型。

在性能上,“天工3.0”已經全面超過3140億參數的MOE大模型Grok1。該大模型也是XAI之前釋出最大的MOE大模型。尤其是在邏輯推理、屬性推理、關系推理、細粒度感覺和粗略感覺等方面均取得較大進步。

邏輯推理方面,“天工3.0”數學與推理能力均提升超過30%。語義了解則能夠更好了解和處理使用者自然語言Query中的複雜語義資訊,包括隐喻、多義詞等。

對于使用者而言,“天工3.0”最大的提升便是在AI搜尋場景上。例如,針對使用者提出的複雜問題,“天工3.0”能夠針對複雜Query進行拆解、細化、并進行追問、資訊了解與補全,使其在自然語義了解方面性能更強,面對不确定性知識時表現更好,能夠更精準、高效地滿足使用者需求。

All in AGI與AIGC,昆侖萬維成果顯著

此外,差別于其他大模型的是,“天工3.0”,僅有文本回複能力,還有圖文并茂能力,例如在搜尋“康乾盛世”時,“天工3.0”在文本回答的同時附帶圖檔或視訊,幫助使用者加強資訊了解。

All in AGI與AIGC,昆侖萬維成果顯著

與上一代大模型相比,“天工3.0”又發展出了更強的多模态性能,例如在對話中,結合文本需求實時生成圖檔、或實時分析内容及圖表的能力,成為了集合聽、說、讀、寫、搜、畫、看、唱等能力的千億級開源MoE大模型。

All in AGI與AIGC對于昆侖萬維而言,從來不是一句口号。“天工3.0”的推出不僅為行業帶來了高效智能的解決方案,格式讓廣大的使用者真正參與到AI大浪潮之中。

天工SkyMusic 引領AI音樂創作浪潮

自OpenAI将大模型推上行業風口以來,中國已經開展了一輪轟轟烈烈的“百模大戰”,各行各業都有屬于自己的通用大模型。唯有音樂領域,還沒有擁有自己的大模型。

與其他行業不同,AI音樂進入門檻較高,此前,AI音樂行業大量研究都集中在符号音樂生成技術路線上,并且大多隻能實作無人聲背景音樂(Background Music,BGM)的生成。但在音樂的品質、效果、審美都打不到專業水準,是以,AI音樂大模型遲遲未能誕生。

但音樂又是大衆最易上手和感受到趣味性的AIGC場景。對于相關企業而言,推出一款音樂大模型是讓相關公司推向C端市場、獲得大衆認知的絕佳機會。

在此背景下,昆侖萬維音樂大模型天工SkyMusic應運而生。據悉,天工SkyMusic不僅是國内唯一公開可用的AI音樂生成大模型,同時也是中國首款AI音樂大模型SOTA模型。

在與海外頂尖的AI音樂大模型Suno V3的橫向測評中,天工SkyMusic在人聲&BGM音質、人聲自然度、發音可懂度等領域顯著領先對手,并以6.65分的綜合得分超越Suno V3,成為全球AI音樂SOTA模型。

一般而言,AI音樂生成有兩大技術路徑,分别是符号音樂生成路線和大模型音樂音頻生成路線。昆侖萬維選擇的音樂音頻生成路線。相較于音樂生成路線,音頻生成路線難度系數更高。

為了突破相關技術難點,昆侖萬維投入了大量的人力、物力,使得該領域的生成品質終于得到提升。

例如,天工SkyMusic擁有獨特的參考音樂生成與方言歌曲生成能力。能夠支援成都話、北京話等衆多方言,讓使用者能夠更自由地實作音樂表達,傳播方言文化。

此外,天工SkyMusic還能通過歌詞控制情緒變化,還支援創作說唱、民謠、放克、古風、電子等多種音樂風格。

借此,天工SkyMusic得以大幅降低原創音樂的創作門檻,讓每個愛好音樂的人能更容易創作屬于自己的歌曲。由于産品性能優越,天工SkyMusic很有可能成為音樂創作領域的現象級産品。

昆侖萬維已經具備成為頂級AI企業的潛力。假以時日,昆侖萬維必将“鳳凰涅槃”,成為引領國内AI潮流的科技企業。

繼續閱讀