01

文生音乐的头把交椅,谁来坐?

2024年3月22日,Suno发布了V3版本,成为文生音乐界的第一个明星产品,被许多人视为“音乐界的‘ChatGPT’”。在Suno爆火后不久,4月10日,文生音乐的头把交椅迎来了新的挑战者,一个被众多体验者称之为“音乐版Sora”的AI大模型——Udio。

打开网易新闻 查看更多图片

眼看着Suno和Udio神仙打架引爆音乐界,国产应用自然不甘示弱。4月17日,国内首款、唯一公开可用的AI音乐生成大模型“天工SkyMusic”正式开启公测,以优异的中文生成效果和无限制的使用引发热议,牢牢抓住了国内市场。

短短时间内,音乐界连续爆发多次大地震,各大AI文生音乐工具被网友吹得神乎其神。到底谁能坐稳文生音乐的头把交椅?我们就以上三个应用进行一场PK大赛。

就应用首页看,Suno、Udio和天工SkyMusic三者都主要放置了音乐创作入口和各类好歌分享。以网页形式登陆的Suno和Udio,都将主要功能列在左侧。相比于Suno中规中矩、一目了然的页面布局,Udio看起来更像是一个跳脱的听歌软件,置顶的创作栏略微有些压缩感,在各色绚丽的音乐图标下很容易让人忽视。天工SkyMusic只能通过“天工”APP进入,仅限于移动端的使用,使功能直接但局限(如图1)。

打开网易新闻 查看更多图片
图1 左上为Suno,左下为Udio,右边为天工SkyMusic

02

Suno、Udio以自由见长

天工SkyMusic更重目标感

当然,单单“纸上谈兵”显得过于虚头巴脑,我们通过具体使用过程对以上三个应用进行音乐生成功能的说明和对比。

表2 功能对比

无须多言,三个应用都支持最基础的自定义歌词和AI写词。就歌词字数而言,Suno推荐2个小节(8行)最佳,Udio推荐200-350字符最佳,天工SkyMusic歌词上限为300字,多余的无法输入。

为了更好地进行比较,我们先在Kimi上输入“请以‘月亮’为主题进行300字以内的歌词创作”的指令进行AI歌词生成,然后将所生成的240字歌词放入这三个应用的“自定义模式”中进行生成音乐的对比。记得在歌词中添加如“主歌”“副歌”“间奏”“桥段”等的段落名称,以方便AI识别我们对于这首歌曲想完成的结构。

我们在Suno和Udio中选择“民谣”的音乐风格。就音乐生成指令看来,以上两者都支持特定音乐风格的输入,而主要区别在于是否能够输入歌手名称。Suno为了防止侵权问题屏蔽了歌手提示词,而Udio可以通过填写艺术家名字来生成与之相关的风格流派标签。同时,Udio还附加一个“Manual Mode(手动模式)”按钮,开启后将禁止应用后台对输入指令进行易于理解的重写。

图2 上为Udio,左下为Suno,右下为天工SkyMusic

但天工SkyMusic无法像上述两者那样让用户输入特定的风格,只支持通过“选择参考歌曲”来控制音乐风格、语言、曲调等。同时,天工SkyMusic中的参考歌曲均是来自用户上传且局限于仅仅30秒。

好的是,可以对清唱或弹唱音频进行旋律生成和声音还原;但不好的是,上传歌曲需要通过其他网站下载音乐后再复制过来。若是不选择“参考歌曲”,天工SkyMusic生成的音乐就像是开盲盒一样,每一首歌都有不同的风格。因此,我们下载了《成都》这一首经典的民谣曲目作为“参考歌曲”进行音乐生成。

在创作完成之后,三个应用都可以通过歌曲卡片直接试听,并一键下载和分享。笔者在这里也发现一个问题。天工SkyMusic生成音乐时长限制在1分40秒左右,Suno默认为2分钟,但Udio的默认生成长度仅有33秒,是Suno的1/4,大概是6句歌词的长度。

打开网易新闻 查看更多图片

所以,想要用Udio完成一首完整的歌曲必须要借助Extend功能。然而Udio的拓展以32秒为单位,也就意味着我们至少得对同一首歌曲进行2次以上的拓展,相对而言确实费时费力。同时,无论是Suno还是Udio,每次拓展不仅是固定时长,也都需要单独生成。这样的设定相对死板,且对于自定义歌词的模式来说非常不友好。

03

Suno均衡,Udio重人声

天工SkyMusic擅中文

除了上手使用的简易程度外,音乐生成效果肯定是我们关注的一大重头戏。以上文中“月亮”主题所生成的音乐为例,我们进行歌曲效果比对,谈一谈所谓的“听后感”。

表3 效果对比

Suno生成的歌曲一开始就有惊艳到笔者,可以说中文发音标准。细听下来,乐声和人声都非常清晰,还原拟真达到了一定的高度。而且所生成的2首歌曲,一点开就能感受到很大区别。

因为30秒的时长限制,Udio的演唱与笔者自定义的歌词有较大出入。不知道是否是因为中文生成能力有限,Udio生成音乐在中文歌词中会混入一些莫名其妙的呢喃。细听中文,可以发现字与字之间的发音有点黏,切割不算干脆。

作为国内的AI音乐大模型,天工SkyMusic的中文发音细腻自然,但生成的3首作品听起来都带着《成都》的影子,而不是民谣风格下的百花齐放,也就是说天工SkyMusic对于“参考歌曲”的参考程度把握可能还需要调整。同时,天工SkyMusic对于段落信息的识别较死板。

单次测试的结果不能代表什么,笔者随后在三个应用的首页试听了多首推荐音乐,发现Udio在人声表现上更加亮眼,音色更细腻,演唱细节也更丰富,反而衬托出Suno有更重的电音音色。天工SkyMusic对于各种语言的生成效果都不错,但可能因为时长限制而无法完整创作所有歌词。这也意味着,我们得到的歌曲,听着听着突然没了。

而就三个应用中独具方言歌曲生成的天工SkyMusic,虽然官方称“能够支持粤语、成都话、北京话等众多方言”,但笔者通过上传《海阔天空》《富士山下》等粤语歌曲和《老子明天不上班》等方言歌曲进行参考,音乐生成效果并没有达到预期,有的甚至识别不出方言,仍是以普通话进行演唱。

总体而言,Suno、Udio和天工SkyMusic各有所长。Suno的音乐生成效率和完整度很高,Udio的长处是对于人声的控制更加精准,而天工SkyMusic不仅操作简单,也更加擅长处理中文。但就个人观感而言,笔者会更倾向于功能全面且均衡的Suno。

在人人都可以是创作者的“AI+音乐”场景中,还需要提醒大家的一点是,使用过程中注意关注版权问题。简而言之,我们尽量将其作为一个玩乐工具,而非盈利工具即可。

微信订阅

邮发代号:77-19

单价:8元,年价:408元

编辑|张毅

审核|吴新

爆料联系:cpcfan1874(微信)

壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者