音樂行業越來越受到巨頭們的關注。過去,比較音樂平台取決于曲目的數量,駐站的藝術家數量,後來更強調版權排他性。現在,以深度神經網絡為代表的AI技術正在逐漸走向地面,放眼世界,音樂平台上的AI大戰即将來臨。
2016年,Google Brain啟動了Magenta項目,該項目更加以學術研究為導向,從早期的NSynth神經網絡音頻合成算法到現在從片段中恢複巴赫音樂的Coconet機器學習模型。
索尼是世界三大音樂版權持有者之一,在音樂内容本身上具有巨大的優勢。2016年,披頭士風格的旋律由Flow Machines建立,Flow Machines是由Sony Computer Science Experiments推出的大型歌曲和風格資料庫。
谷歌和索尼都有流媒體産品,如YouTube音樂服務和索尼的Select Hi-Res。同樣,流媒體可能會颠覆傳統唱片公司和詞曲作者作為版權代理人的地位,他們勢必會在新的工業合作模式中處于領先地位。不同之處在于,索尼需要在其音樂版權業務收入放緩後尋找下一個增長點。
随着智能音箱的普及,谷歌也可以以自己的智能音箱家居為核心,拉動智能家居生态,但依靠低成本補貼吸引消費者智能音箱的趨勢并不理想,未來最終取決于智能互動和全場景覆寫。
微軟的"小冰"面向中國市場已經成長到第七代,基于阿凡達架構的人工智能架構,除了智能對話、語音互動,還注重模拟人聲、寫歌。2018年,微軟小冰還與多家國内企業提出了雙AI半開放生态戰略和平台戰略,但仍未勾勒出清晰的商業邏輯。
在完成對初創公司Jukedeck的收購後,他獲得了印度最大的兩家唱片公司T-Series和Times Music的音樂版權,試圖在其TikTok短視訊産品中使用神經網絡合成音樂。短視訊為AI作曲家提供了實作大規模音樂的有效途徑,或許可以緩解音樂版權的壓力。
目前,谷歌、索尼、微軟小冰,位元組節拍是全力AI,但跌到了AI音樂的水準,卻參差不齊。早期的研究人員更有可能讓計算機模仿現有的音樂剪輯,并通過分析那裡的定律來建立音樂旋律,但人工智能通過允許計算機通過學習大量音樂來"自動"建立相對複雜和有故事的音樂,進而以不同的方式建立音樂。在這個方向上,谷歌和索尼很早就開始探索AI的音樂創作,而被Byte Beats收購的Jukedeck則停留在模仿階段,隻能作為音樂管道上的大規模生産工具。
從某種意義上說,技術進步正在推動音樂産業的每一次進步,從最早的CD到今天的人工智能音樂,音樂的制作,發行和消費都得到了顯着的疊代更新。根據國際唱片業協會(IFPI)的資料,2018年全球音樂收入同比增長9.7%,達到191億美元。對于尋求根深蒂固的業務發展的科技巨頭來說,最終的勝利将取決于對機會的把握。更重要的是,随着巨頭們頻頻出動,AI驅動的音樂市場變化将引發新一輪的競争。
人工智能正在影響全球企業的競争格局,音樂行業正進入人工智能激活多元化價值的關鍵時期。
如今,平安在AI音樂方面的實力遠超人們的想象。
10月11日,為紀念新中國成立70周年,平安人工智能研究院為全球首場公開演出創作了深圳交響樂團全球首部人工智能交響曲《我和我的祖國》。

艾交響曲《我和我的祖國》以中國近代史為基礎,收錄鴉片戰争、新中國成立、共和國曲折發展、改革開放、民族複興等五大樂曲,呈現出一系列曆史變遷。伴随着音頻播放其中的一段曆史故事,表達對祖國的深切感受。
可以說,這是交響樂史上的第一次。在音樂層面,它超越了以往的單維、短空間、娛樂範圍,突破了多元、長篇、古典交響樂,更重要的是,在AI技術的融合上,平安科技自研AVM自動變奏模型訓練系統,然後利用深度學習實作音樂特征的學習和提取,并結合增強的學習技術,讓機器學習改變技術。
從廣義上講,AI構成并不是一個新術語。從最早使用随機統計模型到今天深度神經網絡的應用,人工智能用于智能創造的應用已經成為全球科學家廣泛探索的事物。盡管如此,在研究方法論層面,我們看到了很多反複出現的問題:資料驅動的算法如何避免同質化的音樂風格?人工智能如何更好地"了解"音樂?
帶着這個問題,雷鋒網絡(公衆号:Lei Feng.com)對AI交響樂團"我和我的祖國"田徑隊技術負責人進行了獨家采訪。
"除了一些關于算法和資料标簽的技術工具外,我們還在考慮對音樂音頻進行直接分析,目的是讓人工智能更深入地了解和了解音樂本身。"技術負責人說。
強大的技術鋪路助力,勇敢攀登AI音樂無人之地
事實上,早在一年前,平安AI作曲家就在瑞士聯邦理工學院(EPFL)組織的世界AI作曲家國際大賽中獲得了一等獎。今年2月,平安科技憑借AI的流行歌曲《青春的記憶》獲得清華大學藝術與科學研究中心聯合舉辦的全球AI藝術大賽(GAAC)第一名。
高頻取得突破性成果的背後,離不開平安AI團隊近兩年在智能創造領域的探索積累。早在2017年,平安科技就推出了音樂形象Facebook、音樂流行預測和人工智能作曲三大音樂發展方向,試圖利用AI進入音樂領域。目前,團隊已經積累了大量的标簽分析資料,自主研發可以完成特定任務的生成模型,并内置了符合音樂理論的評價體系。
創作花了近兩個月的時間進行準備,模型訓練的核心部分花了近一個半月的時間。
"通常,一首交響樂的整個創作周期是一年半,實際上隻需要一個半月,但背後卻是兩年的技術儲備、模型學習和資料積累,"AI交響樂團"我和我的國家"音軌團隊的技術總監解釋道。從交響樂變奏的技術角度來看,AI作曲仍面臨巨大挑戰,尤其是在為人類指揮家的識别和表現創作令人滿意的作品方面。"要知道,交響樂不同于一般的音樂生成過程,它們有故事情節,有強烈的情感表達訴求。為此,項目團隊在三個層面上發展技術:
自學AVM自動變異模型
基于節奏、和聲、編織、配置設定等,建立專家變奏規則庫,用于基礎模型訓練,然後利用深度學習和強化學習技術對音樂作品進行多元度特征學習和提取,訓練具有風格融合能力的AVM自動變奏模型。
訓練超過 700,000 套音樂,打造海量級音樂标簽系統
為了進行機器學習并了解音樂的重要特征,該團隊使用了超過70萬首音樂,包括古典音樂,紅歌,民歌等。此外,标簽音樂遵循音樂理論的知識,除了情緒,風格标簽外,還包含主題,發展技巧,和聲,音樂風格,對齊,比對器,調性,音調,節拍數等音樂元素。
靈活使用音樂評估模型和專家規則
機器的進一步學習和強化學習訓練也是基于音樂評估模型,該模型基于建立在對大量作曲家作品研究基礎上的評估網絡。原則是要在遵循主流審美的同時,還要考慮到作曲家的評價标準。同時,為了防止AI作曲生成過于自由,平安在人工智能音樂創作過程中,包括和聲限制、對齊限制、曲面結構限制等規則,包括專家規則。
總的來說,在《我和我的祖國》的改編中,除了原版旋律的開頭和結尾,中間進入到AI變奏曲的創作中。在AI應用過程中,團隊利用深度學習、強化學習和遷移學習的聯合方案,建構了自動變奏模型、音樂評價模型、專家規則體系,基于海量曆史音樂作品資料庫和系統音樂标簽項目,拆解了音樂曲奇組合空間,最好是最佳的音樂片段, 以便完成此建立。
平安AI Plus的獨特基因
那麼,為什麼局外人将金融、醫療保健和智慧城市視為參與看似無關的音樂藝術的綜合金融服務集團呢?
縱觀平安集團30年的跨越式發展,不難看出其背後的驅動力。目前,平安憑借科技賦能金融、平台為依托,打造了金融、醫療、汽車、房地産、智慧城市等五大生态圈,整體業務布局已經顯現,而平安人工智能研究院恰恰是集團底層技術儲備和應用上落地的重要環節。
"平安人工智能研究院的成立主要有兩點:一是深入底層技術的研究和能力儲備,二是将其與目前的企業應用場景相結合,"AI交響樂團"我和我的國家"軌道團隊技術負責人表示。在他看來,人工智能智能創作是該研究所項目組合的重要組成部分之一。雖然落地尚不明朗,更多的是一個比較早期的階段,嘗試探索和示範驗證階段,但在底層技術支援是普遍的。
此前,随着金融、醫療、健康等業務的結合落地,平安推出了智能閃光燈丢失、平安聲音模式、平安筆記OCR識别、平安語音識别、平安語音合成、平安醫學影像等産品。
在雷鋒看來,平安探索"AI音樂"領域的成功,将歸因于三個主要因素:
一個不僅是深度學習技術的儲備,更是團隊對音樂的深刻了解。
平安人工智能研究所AI作曲項目團隊擁有一大批既懂音樂理論又懂電腦算法的人,可以将前沿的AI技術與柔性音樂情感融合,不斷突破人工智能技術的邊界,挖掘AI技術在音樂領域的潛力,實作AI作曲的優化發展。
其次,有一個相對可着地的場景呈現,并且知道如何挖掘,如音樂療法,智能作曲。
從形式上看,在AI變種之後,平安科技也将在古典音樂、流行音樂、作曲、演唱等方面做出更多的嘗試和突破。AI融入藝術創作,大大降低了普通大衆的門檻,可以讓更多的人加入到音樂創作中來,探索出更多形式的音樂,極大地豐富了人們的生活。
第三,資料和場景的不斷積累,将饋送集團在其他産業鍊技術深度,從某種意義上說,這将是次元上的突破。
事實上,平安科技已經在嘗試挖掘一些有趣的場景,以AI的形式釋出更多、更豐富、更個性化的藝術作品。目前,從整個行業來看,短視訊原聲帶、遊戲原聲帶、影視原聲帶等場景已經湧現出不少AI構圖需求。未來,利用AI技術建構多個應用、産品輸出和業務輸出,通過建構多角度的內建解決方案,幫助主營業務和生态層向更加元化、深刻的方向發展。
或許,在平安科技打造差異化優勢的思維中,AI音樂創作隻是一小步嘗試,但這并不影響其結合自身的技術積累,主營業務和優勢行業開始聚焦的力量。除了商業方面的因素外,企業還會因為社會價值層次不同,從不同角度來定義AI藝術的發展有不同程度的影響。
意外地,人工智能給了我們一個新的視角
未來,平安将進一步拓展AI音樂應用的場景和領域,如音樂欣賞、音樂教育、音樂治療等,此外,人工智能技術進一步滲透到人類意識形态的藝術多元領域,如繪畫、詩歌等。
不難想象,人工智能不僅改變了我們的創造力,還帶來了關鍵技術突破。人工智能将如何在未來擴充人類的創造力?如何利用科技拓展藝術邊界,豐富藝術多樣性?人工智能可以繪畫和作曲,但它能像人類創造的那樣動人嗎?
當談到人工智能對藝術産業的轉型時,項目技術上司者認為,使用人工智能進行智能創作實際上可以幫助作曲家和藝術家更有效地創作,并探索他們本來無法做到的作品和風格嘗試。但其中,人為因素仍然是藝術創作中最核心和最重要的部分。
這個答案無疑表明,未來人工智能的最大空間,人工智能取得的成就越多,人類的創造力标準就越高。如何最接近人類意識形态,實作豐富思維和想象力的突破,是AI技術面臨的最大難點。在更多的藝術領域,人工智能技術的介入大大降低了接觸藝術的門檻,也讓藝術領域更深入地走進了生活、産業,甚至在一定程度上,人類精神世界的發展過程。
事實上,AI承載曆史的案例一直在延續:故宮博物院因為AI技術變成了網紅,"清明河圖"因為AI、3D、VR技術讓曆史"真實"流淌在我們面前,而咆哮的巴黎聖母院也會在AI技術中發現另一個新的"自我"。
《我和我的國家》的AI交響曲也是浪漫藝術和嚴謹科學的完美融合。
我們也看到,我國的許多技術在新中國成立70周年的長卷中帶來了革命性的突破。早期的基于控制的核技術,以打破對超級計算機技術的封鎖,到載人航天衛星技術,都取得了國力的飛躍。
經過70多年的工業化和資訊化,我們進入了智能化的新時代,平安《我和我的祖國》AI交響樂克服了技術壁壘,在一定程度上,人工智能技術進入了一個新的領域,勢必留下一個其豐富多彩的偉大曆史節點。
源|雷 Feng.com,轉載請注明出處
注:本文為作者獨立觀點,不代表Soo56的立場