音乐行业越来越受到巨头们的关注。过去,比较音乐平台取决于曲目的数量,驻站的艺术家数量,后来更强调版权排他性。现在,以深度神经网络为代表的AI技术正在逐渐走向地面,放眼世界,音乐平台上的AI大战即将来临。
2016年,Google Brain启动了Magenta项目,该项目更加以学术研究为导向,从早期的NSynth神经网络音频合成算法到现在从片段中恢复巴赫音乐的Coconet机器学习模型。
索尼是世界三大音乐版权持有者之一,在音乐内容本身上具有巨大的优势。2016年,披头士风格的旋律由Flow Machines创建,Flow Machines是由Sony Computer Science Experiments推出的大型歌曲和风格数据库。
谷歌和索尼都有流媒体产品,如YouTube音乐服务和索尼的Select Hi-Res。同样,流媒体可能会颠覆传统唱片公司和词曲作者作为版权代理人的地位,他们势必会在新的工业合作模式中处于领先地位。不同之处在于,索尼需要在其音乐版权业务收入放缓后寻找下一个增长点。
随着智能音箱的普及,谷歌也可以以自己的智能音箱家居为核心,拉动智能家居生态,但依靠低成本补贴吸引消费者智能音箱的趋势并不理想,未来最终取决于智能交互和全场景覆盖。
微软的"小冰"面向中国市场已经成长到第七代,基于阿凡达框架的人工智能框架,除了智能对话、语音交互,还注重模拟人声、写歌。2018年,微软小冰还与多家国内企业提出了双AI半开放生态战略和平台战略,但仍未勾勒出清晰的商业逻辑。
在完成对初创公司Jukedeck的收购后,他获得了印度最大的两家唱片公司T-Series和Times Music的音乐版权,试图在其TikTok短视频产品中使用神经网络合成音乐。短视频为AI作曲家提供了实现大规模音乐的有效途径,或许可以缓解音乐版权的压力。
目前,谷歌、索尼、微软小冰,字节节拍是全力AI,但跌到了AI音乐的水平,却参差不齐。早期的研究人员更有可能让计算机模仿现有的音乐剪辑,并通过分析那里的定律来创建音乐旋律,但人工智能通过允许计算机通过学习大量音乐来"自动"创建相对复杂和有故事的音乐,从而以不同的方式创建音乐。在这个方向上,谷歌和索尼很早就开始探索AI的音乐创作,而被Byte Beats收购的Jukedeck则停留在模仿阶段,只能作为音乐管道上的大规模生产工具。
从某种意义上说,技术进步正在推动音乐产业的每一次进步,从最早的CD到今天的人工智能音乐,音乐的制作,发行和消费都得到了显着的迭代升级。根据国际唱片业协会(IFPI)的数据,2018年全球音乐收入同比增长9.7%,达到191亿美元。对于寻求根深蒂固的业务发展的科技巨头来说,最终的胜利将取决于对机会的把握。更重要的是,随着巨头们频频出动,AI驱动的音乐市场变化将引发新一轮的竞争。
人工智能正在影响全球企业的竞争格局,音乐行业正进入人工智能激活多元化价值的关键时期。
如今,平安在AI音乐方面的实力远超人们的想象。
10月11日,为纪念新中国成立70周年,平安人工智能研究院为全球首场公开演出创作了深圳交响乐团全球首部人工智能交响曲《我和我的祖国》。

艾交响曲《我和我的祖国》以中国近代史为基础,收录鸦片战争、新中国成立、共和国曲折发展、改革开放、民族复兴等五大乐曲,呈现出一系列历史变迁。伴随着音频播放其中的一段历史故事,表达对祖国的深切感受。
可以说,这是交响乐史上的第一次。在音乐层面,它超越了以往的单维、短空间、娱乐范围,突破了多维、长篇、古典交响乐,更重要的是,在AI技术的融合上,平安科技自研AVM自动变奏模型训练系统,然后利用深度学习实现音乐特征的学习和提取,并结合增强的学习技术,让机器学习改变技术。
从广义上讲,AI构成并不是一个新术语。从最早使用随机统计模型到今天深度神经网络的应用,人工智能用于智能创造的应用已经成为全球科学家广泛探索的事物。尽管如此,在研究方法论层面,我们看到了很多反复出现的问题:数据驱动的算法如何避免同质化的音乐风格?人工智能如何更好地"理解"音乐?
带着这个问题,雷锋网络(公众号:Lei Feng.com)对AI交响乐团"我和我的祖国"田径队技术负责人进行了独家采访。
"除了一些关于算法和数据标签的技术工具外,我们还在考虑对音乐音频进行直接分析,目的是让人工智能更深入地理解和理解音乐本身。"技术负责人说。
强大的技术铺路助力,勇敢攀登AI音乐无人之地
事实上,早在一年前,平安AI作曲家就在瑞士联邦理工学院(EPFL)组织的世界AI作曲家国际大赛中获得了一等奖。今年2月,平安科技凭借AI的流行歌曲《青春的记忆》获得清华大学艺术与科学研究中心联合举办的全球AI艺术大赛(GAAC)第一名。
高频取得突破性成果的背后,离不开平安AI团队近两年在智能创造领域的探索积累。早在2017年,平安科技就推出了音乐形象Facebook、音乐流行预测和人工智能作曲三大音乐发展方向,试图利用AI进入音乐领域。目前,团队已经积累了大量的标签分析数据,自主研发可以完成特定任务的生成模型,并内置了符合音乐理论的评价体系。
创作花了近两个月的时间进行准备,模型训练的核心部分花了近一个半月的时间。
"通常,一首交响乐的整个创作周期是一年半,实际上只需要一个半月,但背后却是两年的技术储备、模型学习和数据积累,"AI交响乐团"我和我的国家"音轨团队的技术总监解释道。从交响乐变奏的技术角度来看,AI作曲仍面临巨大挑战,尤其是在为人类指挥家的识别和表现创作令人满意的作品方面。"要知道,交响乐不同于一般的音乐生成过程,它们有故事情节,有强烈的情感表达诉求。为此,项目团队在三个层面上发展技术:
自学AVM自动变异模型
基于节奏、和声、编织、分配等,建立专家变奏规则库,用于基础模型训练,然后利用深度学习和强化学习技术对音乐作品进行多维度特征学习和提取,训练具有风格融合能力的AVM自动变奏模型。
训练超过 700,000 套音乐,打造海量级音乐标签系统
为了进行机器学习并理解音乐的重要特征,该团队使用了超过70万首音乐,包括古典音乐,红歌,民歌等。此外,标签音乐遵循音乐理论的知识,除了情绪,风格标签外,还包含主题,发展技巧,和声,音乐风格,对齐,匹配器,调性,音调,节拍数等音乐元素。
灵活使用音乐评估模型和专家规则
机器的进一步学习和强化学习训练也是基于音乐评估模型,该模型基于建立在对大量作曲家作品研究基础上的评估网络。原则是要在遵循主流审美的同时,还要考虑到作曲家的评价标准。同时,为了防止AI作曲生成过于自由,平安在人工智能音乐创作过程中,包括和声约束、对齐约束、曲面结构约束等规则,包括专家规则。
总的来说,在《我和我的祖国》的改编中,除了原版旋律的开头和结尾,中间进入到AI变奏曲的创作中。在AI应用过程中,团队利用深度学习、强化学习和迁移学习的联合方案,构建了自动变奏模型、音乐评价模型、专家规则体系,基于海量历史音乐作品数据库和系统音乐标签项目,拆解了音乐曲奇组合空间,最好是最佳的音乐片段, 以便完成此创建。
平安AI Plus的独特基因
那么,为什么局外人将金融、医疗保健和智慧城市视为参与看似无关的音乐艺术的综合金融服务集团呢?
纵观平安集团30年的跨越式发展,不难看出其背后的驱动力。目前,平安凭借科技赋能金融、平台为依托,打造了金融、医疗、汽车、房地产、智慧城市等五大生态圈,整体业务布局已经显现,而平安人工智能研究院恰恰是集团底层技术储备和应用上落地的重要环节。
"平安人工智能研究院的成立主要有两点:一是深入底层技术的研究和能力储备,二是将其与当前的企业应用场景相结合,"AI交响乐团"我和我的国家"轨道团队技术负责人表示。在他看来,人工智能智能创作是该研究所项目组合的重要组成部分之一。虽然落地尚不明朗,更多的是一个比较早期的阶段,尝试探索和演示验证阶段,但在底层技术支持是普遍的。
此前,随着金融、医疗、健康等业务的结合落地,平安推出了智能闪光灯丢失、平安声音模式、平安笔记OCR识别、平安语音识别、平安语音合成、平安医学影像等产品。
在雷锋看来,平安探索"AI音乐"领域的成功,将归因于三个主要因素:
一个不仅是深度学习技术的储备,更是团队对音乐的深刻理解。
平安人工智能研究所AI作曲项目团队拥有一大批既懂音乐理论又懂电脑算法的人,可以将前沿的AI技术与柔性音乐情感融合,不断突破人工智能技术的边界,挖掘AI技术在音乐领域的潜力,实现AI作曲的优化发展。
其次,有一个相对可着地的场景呈现,并且知道如何挖掘,如音乐疗法,智能作曲。
从形式上看,在AI变种之后,平安科技也将在古典音乐、流行音乐、作曲、演唱等方面做出更多的尝试和突破。AI融入艺术创作,大大降低了普通大众的门槛,可以让更多的人加入到音乐创作中来,探索出更多形式的音乐,极大地丰富了人们的生活。
第三,数据和场景的不断积累,将馈送集团在其他产业链技术深度,从某种意义上说,这将是维度上的突破。
事实上,平安科技已经在尝试挖掘一些有趣的场景,以AI的形式发布更多、更丰富、更个性化的艺术作品。目前,从整个行业来看,短视频原声带、游戏原声带、影视原声带等场景已经涌现出不少AI构图需求。未来,利用AI技术构建多个应用、产品输出和业务输出,通过构建多角度的集成解决方案,帮助主营业务和生态层向更加元化、深刻的方向发展。
或许,在平安科技打造差异化优势的思维中,AI音乐创作只是一小步尝试,但这并不影响其结合自身的技术积累,主营业务和优势行业开始聚焦的力量。除了商业方面的因素外,企业还会因为社会价值层次不同,从不同角度来定义AI艺术的发展有不同程度的影响。
意外地,人工智能给了我们一个新的视角
未来,平安将进一步拓展AI音乐应用的场景和领域,如音乐欣赏、音乐教育、音乐治疗等,此外,人工智能技术进一步渗透到人类意识形态的艺术多维领域,如绘画、诗歌等。
不难想象,人工智能不仅改变了我们的创造力,还带来了关键技术突破。人工智能将如何在未来扩展人类的创造力?如何利用科技拓展艺术边界,丰富艺术多样性?人工智能可以绘画和作曲,但它能像人类创造的那样动人吗?
当谈到人工智能对艺术产业的转型时,项目技术领导者认为,使用人工智能进行智能创作实际上可以帮助作曲家和艺术家更有效地创作,并探索他们本来无法做到的作品和风格尝试。但其中,人为因素仍然是艺术创作中最核心和最重要的部分。
这个答案无疑表明,未来人工智能的最大空间,人工智能取得的成就越多,人类的创造力标准就越高。如何最接近人类意识形态,实现丰富思维和想象力的突破,是AI技术面临的最大难点。在更多的艺术领域,人工智能技术的介入大大降低了接触艺术的门槛,也让艺术领域更深入地走进了生活、产业,甚至在一定程度上,人类精神世界的发展过程。
事实上,AI承载历史的案例一直在延续:故宫博物院因为AI技术变成了网红,"清明河图"因为AI、3D、VR技术让历史"真实"流淌在我们面前,而咆哮的巴黎圣母院也会在AI技术中发现另一个新的"自我"。
《我和我的国家》的AI交响曲也是浪漫艺术和严谨科学的完美融合。
我们也看到,我国的许多技术在新中国成立70周年的长卷中带来了革命性的突破。早期的基于控制的核技术,以打破对超级计算机技术的封锁,到载人航天卫星技术,都取得了国力的飞跃。
经过70多年的工业化和信息化,我们进入了智能化的新时代,平安《我和我的祖国》AI交响乐克服了技术壁垒,在一定程度上,人工智能技术进入了一个新的领域,势必留下一个其丰富多彩的伟大历史节点。
源|雷 Feng.com,转载请注明出处
注:本文为作者独立观点,不代表Soo56的立场