目前AI主要用在伴奏樂曲制作、歌曲制作及人聲合成等環節。随着技術的進步,AI在替代人方面可能取得明顯進步,也可能融合在各種專業工具中,提升人的工作效率。
文/崔粲 億歐智庫分析師
最近,億歐智庫釋出了《2017 人工智能+内容生産研究報告》,報告中分析了AI在文本、音頻、圖像、視訊、互動内容五大類内容領域的應用情況。5類内容各領域中,新聞、設計和音頻是目前AI實際應用進展最領先的領域。在億歐智庫看來,AI可能很适合用在音樂領域應用,前景比很多人想象的要好。
音頻、音樂領域很寬,目前AI涉及到的,主要是伴奏樂曲制作、歌曲制作及人聲合成等環節。
伴奏樂曲方面,目前AI應用的最多。電影、電視節目、APP、遊戲、視訊等,很多都需要無人聲的背景音樂,針對這項需求,市面也形成了高低檔不同的産業鍊。高端市場,如大制作影視制作,有這方面預算,專門邀請音樂公司定制背景音樂。低端市場,如小工作室做視訊,基本上網上下載下傳免費或盜版的。中檔市場可能會比較尴尬,預算不足夠多做定制,卻也需要有版權的合适音樂。
AI作曲,或許剛好能夠滿足一部分中、低檔背景音樂的需求。目前的幾家AI作曲公司,可以通過設定樂曲類型、情緒、樂器、時長等,自動生成一段音樂,不滿意的情況下,還可以再次重新生成一次,比人效率高了很多。AI生成的樂曲還可以線上進一步修改和編輯。創業公司Amper Music的AI Amper,Jukedeck都輸入這種。Google和多倫多大學,則分别進行了基于彈奏任意旋律和圖檔生成樂曲的研究。

AI作曲中,還有一類面向更專業的古典音樂作曲的公司。加州大學聖克魯茲分校的David Cope教授,通過研究巴赫、貝多芬、肖邦等大師譜曲的特點,花了7年編寫了專門模仿大師風格譜曲的程式EMI。短時間内就創作了幾千首類似風格作品。Cope教授研發EMI時,深度神經網絡還沒發展起來,如今通過深度神經網絡,這一過程可能要快的多。盧森堡的創業公司Aiva也使用AI生産古典音樂曲譜,再由人演奏錄制成專業樂曲,已經給為盧森堡國慶日開幕式、英偉達GPU大會等活動創作了樂曲,還通過了法國和盧森堡作者權利協會(SACEM)的注冊,享有和人類一樣的署名版權。
專業歌手歌曲的制作過程中,AI也已經有應用,AI參與到題材選擇、作曲、編曲及人聲合成等環節。
歌手Alexa在創作新作品前,使用AI分析了過往各題材作品的使用者回報情況,最後在AI幫助下選擇了“心碎”作為他單曲《Not Easy》的主題。單曲釋出後不久,在iTunes熱門歌曲排行榜上沖到第四位。
索尼CSL實驗室研發的FlowMachine,則是同時具備多項功能,可以自動作曲、互動作曲、配和聲、變奏、渲染等。FlowMachine能夠模仿特定名人的音樂風格。由AI負責作曲和編曲,真人和聲和填詞,FlowMachine釋出了兩首分別是披頭士風格的歌曲《Daddy’s Car》和爵士樂風格的歌曲《Mister Shadow》。Amper的AI Amper則是參與了歌手Taryn Southern新專輯《I AM AI》中的歌曲《Break Free》的編曲等環節。
中國創業公司班磚網絡研發的AI,則能夠根據給出的歌詞自動作出旋律,再由人完成其餘合成工作。
目前的語音合成技術還不能完全模拟人聲,但如微軟小冰等AI,已經可以學習一段人的聲音,之後合成出模拟人聲的歌聲。這一方式比之前虛拟偶像領域使用VOCALOID進行合成效率高了很多。Adobe之前也展示過人聲合成修改軟體Project Voco,不過軟體還沒正式釋出。
之是以AI能夠在音樂領域得到很多應用,跟音樂本身兩個特點有關:
一是評價标準非常主觀。音樂好聽不好聽,沒有清晰評價标準,評價結果因人而異,是以對結果沒有硬性要求,對技術上的要求也就相對低些。
二是音樂本身邏輯性差。目前的AI還不具備推理能力,是以難以處理需要前後邏輯嚴密的内容,如小說。但是音樂本身就跳動性非常強,前後音符間可以沒有邏輯關系,技術角度也就更容易做出來。從樂理角度,旋律可以進行分節,節之間有一些知識性規律,這些規律也可以寫入程式中,增強AI的作曲能力。
随着技術的進步,AI在音樂領域能夠完成任務、作曲的品質肯定還能提高。未來比音樂人更便宜和高效的AI,可能還會擴充應用範圍。在高端領域,AI還不能替代音樂家,但也不排除AI未來具備模仿音樂家的能力。除了替代人,未來更多的情況下,AI可能被嵌入各種專業音樂軟體中,進而提高整個行業工作效率。
文章内容系作者個人觀點,不代表億歐對觀點贊同或支援;轉載請注明作者姓名和來源。