天天看點

前沿分享丨又來了?!生成式AI在文娛界到底能掀起多大波瀾?

作者:中國人工智能學會

轉自 機器之能

AI音樂生成軟體 Suno V3 在釋出後引起極大關注,媒體傳OpenAI 要将 Sora 賣給好萊塢。這兩項音樂生成和視訊生成工具的動态引起了業界對生成式 AI 在文娛行業應用機會的讨論。

本期要點

Sora 和 Suno 在文娛界最近有多火?

GenAI 真的能用之後會發生什麼?

Sora 和 Suno 之前有過哪些生成式方法?

GenAI 在文娛行業還有哪些應用?

生成式 AI 在文娛行業又起波瀾??

Suno 團隊推出的 AI 音樂生成軟體 V3 版本,憑借其出色的性能表現,被業界譽為“音樂界的 ChatGPT”。該版本能夠創作長達兩分鐘的音樂作品,其音質達到了廣播級别的标準。此外,V3 版本在風格多樣性和對使用者輸入的了解上均有所提升,減少了生成過程中的誤差。

在V3 釋出前,Suno 團隊在音樂技術領域的成果已經得到了市場認可。根據 a16z 釋出的 GenAI Top100 報告,Suno 在近六個月(截止1月4日)内成為最受矚目的 GenAI 應用之一,并作為唯一一家音樂公司上榜。

在此之前,Suno 團隊在 2023 年 4 月釋出的開源文本轉音頻模型 Bark,短時間内在 Github 上獲得了超過 4500 個星标。

  • 7 月,Suno 為音頻生成模型增加人聲音樂功能。
  • 9 月,Suno 通過 Discord 頻道為使用者提供音頻生成模型的通路入口。
  • 12 月,Suno 推出 web 端應用,并宣布與微軟合作,在 Copilot 中內建 Suno 的模型能力。

在視訊創作領域,OpenAI 于 2 月 15 日釋出的視訊生成模型 Sora,憑借其能夠生成一分鐘高品質視訊的能力,引起了業界的廣泛關注。除了引起國内外對 Sora 的複現熱潮,媒體還曝出OpenAI 首席執行官 Sam Altman 近期在奧斯卡頒獎典禮期間的活動中出現,并計劃與娛樂産業的高層進行會談,探讨合作機會。而 OpenAI 在上周分享的由藝術家使用 Sora 創作的作品則又一次吸引了大量目光。

當 GenAI 開始真的有用,下一步會發生什麼?

就 AI 生成音樂而言,其難度在于:

1、音樂結構複雜,情感豐富,AI 需掌握音樂理論和模拟人類情感。

2、高質音樂資料集對 AI 訓練至關重要,但擷取多樣化、高品質資料依然困難。

3、音樂領域某些模式涉及較長的時間跨度,目前的模型在記憶并利用這些資訊以生成連貫作品方面仍然困難。

4、音樂涉及風格和情感的表達, AI 需要捕捉特定風格,同時需要了解和模拟音樂的情感層面。

5、音樂品質評估是一項主觀過程,缺乏客觀标準,導緻音樂生成模型的改進回報機制不成熟。

Suno V3 雖然在音樂創作方面取得了一定的成就,但在時長、語言了解能力和音軌處理等方面仍有待提高。盡管如此,其作為音樂創作者的輔助工具的功能已經初步實作。

  • 對于普通使用者而言,AI 工具能夠降低創作門檻,使得更多的人能夠通過簡單的方式進行自我表達;
  • 對于專業使用者來說,AI 工具可以作為提高創作效率的創意助手。

随着 AI 音樂創作工具的逐漸成熟,未來可能會對音樂産業産生多方面的影響。技術的進步和公司的市場定位可能會推動音樂領域的 GenAI 發展出面向企業(toB)和面向消費者(toC)的商業模式。此外,基于 GenAI 的内容生成工具,結合釋出管道和互動功能,有潛力建構起一個完整的内容生态系統,實作内容的變現和創作者的收益配置設定。同時,GenAI 技術的應用有望縮小業餘和專業創作者之間的技能差距,使得更多業餘創作者能夠通過 AI 技術實作高品質的創作。

盡管存在對 Suno 可能對音樂行業造成沖擊的擔憂,但目前業界普遍認為 AI 技術不太可能完全取代專業音樂人,而是可能影響那些技術要求相對較低的從業者。愛夢科技的 CEO 雷鳴指出,Suno 不太可能取代需要團隊合作創作的音樂形式,也不會影響到知名音樂人的職業前景。但他也提到,那些不追求獨特性、傾向于批量創作的公司和領域,如廣告配樂、環境音樂、影視配音等,可能會受到 AI 技術的沖擊。

在視訊生成技術方面,Factorial Funds 的分析指出,盡管 Sora 模型存在一定的局限性,但其生成的視訊品質已經能夠滿足特定場景的需求,并有望替代一些庫存視訊片段。Sora 的成功展示了視訊模型中 Scaling law 的重要性,持續的模型擴充将是提升模型能力的關鍵因素。同時,其他公司如 Runway、Genmo 和 Pika 等,正在探索如何建構更加直覺的使用者界面和工作流程,這将對視訊生成模型的易用性和推廣性産生重要影響。....

GenAI 走了多遠才帶來 Sora 和 Suno?GenAI 走向商業化還有什麼問題要解決?Sora 和 Suno 之外,GenAI 近期還有什麼文娛應用讓人眼前一亮?... 檢視完整解讀請前往「機器之心PRO」業内通訊 · 2024年度#Week 13

本期完整版通訊含 3 個專題解讀 + 31 項 AI & Robotics 賽道要事收錄

1. LLM 之後,「Next token Prediction」還能訓機器人?

為什麼說「預測好下一個 token,就能達到 AGI」?NTP 技術是什麼?伯克利是如何用 NTP 的思路訓機器人的?「Next Action Prediction」在機器人領域能走通嗎?...

2. 生成式 AI 又要在文娛掀起波瀾了?

Sora 和 Suno 在文娛界最近有多火?GenAI 真的能用之後會發生什麼?Sora 和 Suno 之前有過哪些生成式方法?GenAI 在文娛行業還有哪些應用?...

3.Richard Sutton 最新播客内容要點解讀

Richard Sutton 在播客訪談中都透露了哪些關鍵資訊?阿爾伯塔計劃進展到哪一步了?Sutton 對于 AGI 的實作有哪些新思路?...

【免責聲明】轉載出于非商業性的教育和科研目的,隻為學術新聞資訊的傳播,版權歸原作者所有,如有侵權請立即與我們聯系,我們将及時删除。