字节博士搞的AI火了，一键完美分离人声和伴奏

博雯发自凹非寺
量子位报道 | 公众号 QbitAI

写歌填词、改换风格、续写音乐的AI，今天又来做编曲人了！

上传一段《Stay》，一键按下：

伴奏和人声就轻松分离：

（点击文末链接听分离得到的人声、伴奏音频）

人声颇有种在空旷地带清唱的清晰感，背景乐都能直接拿去做混剪了！

这样惊人的效果也引发了Reddit热议：

这项研究的主要负责人孔秋强来自字节跳动，全球最大的古典钢琴数据集GiantMIDI-Piano，也是由他在去年牵头发布的。

那么今天，他又带来了怎样的一个AI音乐家呢？

一起来看看。

基于深度残差网络的音源分离

这是一个包含了相位估计的音乐源分离（MSS）系统。

首先，将幅值（Magnitude）与相位（Phase）解耦，用以估计复数理想比例掩码（cIRM）。

其次，为了实现更灵活的幅值估计，将有界掩码估计和直接幅值预测结合起来。

最后，为MSS系统引入一个143层的深度残差网络（Deep Residual UNets），利用残差编码块（REB）和残差解码块（RDB）来增加其深度：

残差编码块和残差卷积块中间还引入了中间卷积块（ICB），以提高残差网络的表达能力。

其中每个残差编码块由4个残差卷积块（RCB）组成，残差卷积块又由两个核大小为3×3的卷积层组成。

每个残差解码块由8个卷积层和1个反卷积层组成。

实验结果

接下来，将这一系统在MUSDB18数据集上进行实验。

MUSDB18中的训练/验证集分别包含100/50个完整的立体声音轨，包括独立的人声、伴奏、低音、鼓和其他乐器。

在训练时，利用上述系统进行并行的混合音频数据增强，随机混合来自同一来源的两个3秒片段，然后作为一个新的3秒片段进行训练。

以信号失真率（SDR）作为评判标准，可以看到ResUNetDecouple系统在分离人声、低音、其他和伴奏方面明显优于以前的方法：

在消融实验中，143层残差网络的表现也证实了，结合有界掩码估计和直接幅值预测确实能够改善声音源分离系统的性能。

作者介绍

这项研究的论文一作为孔秋强，本硕都毕业于华南理工大学，博士则毕业于英国萨里大学的电子信息工程专业。

他在2019年加入字节跳动的Speech, Audio and Music Intelligence研究小组，主要负责音频信号处理和声音事件检测等领域的研究。

论文：
https://arxiv.org/abs/2109.05418

试玩：
https://huggingface.co/spaces/akhaliq/Music_Source_Separation

开源地址：
https://github.com/bytedance/music_source_separation

试听链接：
https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247594465&idx=3&sn=83a18be3019dbecd6040031618d112dc&chksm=e8d1c693dfa64f85e7db0f5157d533361da6c8b71a9ceacdfc29a28399bd6d0bade7a046014f&token=497180065&lang=zh_CN#rd

字节博士搞的AI火了，一键完美分离人声和伴奏 | 在线可玩

4月20日，北大运动会“机器人太奶”走红，24日代理公司回应：机器人是开放平台可编程，配齐大概80万

美参议院投票通过向乌克兰和以色列援助法案

耿彦波留给大同的这块警示碑再引关注：华严寺综治犯三错，明耻彰过

内蒙古开鲁县被免职镇党委副书记学历造假？县委组织部：正调查核实，结果将及时公布

沉默的日本，衰落的国运

媒体：布林肯应约来访这次和上一次的访问明显不同

上海江边多人跑步被保安拦，“你们衣服一样的！”公园：统一着装要报备，不能拍照

太蹊跷！上海小区一报废车长期占据车位，车主按时、足额交停车费，投资已过万，物业很无奈

工商银行突然设立人民武装部，释放了什么信号？逻辑是什么？

广州民政回应“哲学硕士拟聘为火化工”，殡葬业人士：薪酬没流传的那么夸张

中部三省外贸失速，河南一季度手机出口减少1000万台

官方回应社保缴满15年就坐等退休

19连跌！沪牌竞拍人数逐月下降高峰时曾超27万人

大反转！5600亩承包费用曝光，擅自改变土地性质，转租每年赚百万

“准00后”的她，破格提拔为副镇长

NBA官宣年度奖项：里德当选最佳第六人击败蒙克波蒂斯成功捧杯

利物浦0-2埃弗顿！近3轮输2场，落后英超榜首3分，努涅斯错失单刀

杨利伟获得钱学森最高成就奖

干部阻拦春耕最新进展：让敛钱人被扒出，纪云浩部队照惹质疑

被指香港金融史重大时刻华夏博时嘉实三家现货比特币、以太币ETF获批