只需1分钟，这个网站用AI分离歌曲的人声、伴奏和乐器声

　　整理：Just，出品：AI 科技大本营（ID:rgznai100）

　　疫情期间，在家待着闲来无事，一些技术人员就喜欢以技术的方式找点乐子，顺带赚钱最好了。

　　将歌曲中的人声和乐器声分离是一件让想使用音乐伴奏的人头疼的事情，传统的音乐制作软件使用门槛较高，处理起来不光费时而且效果不一定好。

　　团子 DanGo.ai（https://dango.ai/）——微博网友@无吔学生近期利用 AI 技术做的这个能分离音频轨道的网站火了。

　　在音乐分离这一领域，实际上已经有一些免费的 AI 工具。比如，由法国音乐流媒体服务公司 Deezer 为研究目的而开发的 Spleeter 开源工具，只需要提供一个音频文件，然后 Spleeter 就会将它分成两个、四个或五个独立的音轨，非常有用。

　　团子 DanGo.ai 就是基于 Spleeter 开源工具做的。利用 AI 技术并通过上千首歌曲数据的训练，用户只需要上传歌曲，等待 1 分钟，目前就可以提取歌曲中的伴奏、人声、钢琴、贝斯、鼓点等多音轨压缩文件，效果要好于 Au 或者 GoldWave 之类的传统音频处理软件。

　　@无吔学生表示，这是他秃了一个月头的成果。

　　据网站作者介绍。团子主要由基于 MIT 协议的开源项目 Spleeter 制作的，同时在其之上增加了一些功能魔改使效率与音质得到提升。团子基于深度神经网络（DNN）实现的音轨分离所诞生的人工智能，它使用 Python/Tensorflow 开发。

　　那么，团子 DanGo.ai 与传统的音乐分离软件有什么不同？

　　一般而言，传统音乐分离软件所谓的“消音”一般是简单的带阻滤波，用人话说就是把人声所在的频率直接暴力擦除，这就会导致消音后的歌曲变得特别“糊”——表现为鼓点、某些乐器的消失。作者解释，这是因为人声会和某些相同频率的乐器重叠，单纯的抠除这个频率，不光会消除人声，也会消除在这个频率里的乐器。而根据歌曲的不同，人声/和声所在的频率也并非固定，这就导致提取出的伴奏不但效果糟糕，而且仍然带着部分残余的人声。

　　“当然，也有一些人发现，歌曲中的人声录音一般是单声道的，而歌曲的乐器未必是这样。于是人们也尝试使用左右声道“相减”（如 Au 中的中置声道提取器）来提取伴奏或人声。但是提取的效果基本仍然很差，因为无法保证乐器不是多声道的，也无法保证人声是否被混音师加了后期处理效果器而变成多声道，所以它并不适合多数歌曲（尤其是现代音乐）。”

　　作者称，团子 DanGo.ai 则不用考虑上述让人心智损伤的事情。该软件用了大量的音乐数据进行训练，“我们可以把团子想象成一个大脑——我们让它听了非常多的歌曲用来“训练”它。现在它非常懂得歌曲，理解歌曲中各个乐器的存在，也能谨慎细心的剥离开人声和伴奏，从而最大程度的保留各个音轨的质量。”

　　目前，用户可用团子 DanGo.ai 网站试听 5 首分离的多音轨歌曲。当然，如果你想要更多高质量的生成歌曲还需付费，付费歌曲会保留 30 天的歌曲文件让用户下载。

只需1分钟，这个网站用AI分离歌曲的人声、伴奏和乐器声

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复