文|陈斯达

编辑|邓咏仪

音乐界也被AI拿下。

莫扎特和贝多芬如果在世,得到的是或许是惊吓而不是惊讶——怎么大伙儿几秒就能“写”出专业水准的歌?

这支音乐界的马良神笔,便是文生音乐模型Suno V3,由AI音乐生成创企Suno AI于3月22日发布。

打开网易新闻 查看更多图片

图源:X

与此前发布的V2相比,V3生成的作品质量提升明显,涵盖风格流派更多,对提示词的依从性更强,幻觉问题更少。

创作词曲的同时,Suno还把专辑封面都设计好了。

Suno的首页榜单里,已经出现涵盖不同语言、风格迥异的曲子。

一首名为We Go!的中文重金属摇滚播放直逼13万,点赞过千,在众多英文歌中显得格外耀眼。

图源:Suno

还有把宫保鸡丁的食谱作为prompt的,写出一首歌剧。

打开网易新闻 查看更多图片

图源:Suno

好玩易上手,曲子给你改到满意为止

Suno的创作界面大道至简:输入提示词,稍等片刻,便能等来一段两分钟长的曲子。

咱要求也别太高,先不说是不是真好听,Suno至少兑现了承诺——”曲由心生(From your mind to music)“。

Suno有两个可选按钮——“自定义”与“纯音乐”。

点”自定义”,相当于开“手动挡”,即自行填词,细化音乐流派,给即将生成的作品提前取歌名。这样能对生成的作品有更多决定空间。

点“纯音乐”,即不能生成与自定义歌词了。

图源:Suno

和当下Midjourney、Pika等AIGC应用的逻辑类似——“傻瓜式”操作,提需求即可。

但你要做一个合格的甲方,至少告诉Suno需要的主题、流派、风格、情绪、乐器、人声。毕竟创作有一定水准的、或者脑海中的音乐,少不了精准全面的提示词prompt。

虽然练习时长只有两分半,但有了ChatGPT和Claude,就能做你的创作小助理(甚至已有相关插件)。

图源:ChatGPT

心里有数之后,又让GPT给我总结了几个词(cyberpunk, futuristic, tension, synthesizers),随后把颗粒度给Suno对齐,实现一套赛博作曲组合拳。

乙方Suno就给我反馈了作品。还别说,真像那么回事!

打开网易新闻 查看更多图片

Suno生成的曲目,图源:Suno

但不是特别满意的地方在于:鼓点加的太迟了,节奏不够快。再改!点击歌曲封面下方的Remix,Suno就支持在原曲基础上迭代修改了。

除了自己创作的曲目,其他用户上传的作品里,如果你喜欢,也能点击“在原曲基础上创作”(Continue From This Song),打造自己的新曲目!

图源:Suno

目前,在免费版里,Suno所有功能都能体验。每天50积分能写10首歌,质量好点,还能凑合着发个专辑。你说自己创作欲爆棚?就是另外的价钱了。每月10刀升级成Pro Plan,够你写500首!

Suno的付费标准,图源:Suno

但玩笑归玩笑。Suno在官网里明确指出,只有尊贵的付费玩家才能将生成的歌曲用于商业目的。

Suno对版权的表述,图源:Suno

没付钱问题也不大,你写的歌,Suno帮你记着,等哪天你付钱了才变成你的。只是发发社交媒体,完全没问题。

更别说如果你的歌收集到网友们足够多的赞,还有机会登上Suno自己的Trending榜单。亲自写歌打榜,你就是朋友圈里最靓的仔!

打开网易新闻 查看更多图片

Suno里的热歌榜,图源:Suno

像GPT一样训练,让10亿人更多参与音乐

世界上听歌的远远多过做歌的人,Suno 正是要打破这种不平衡。

据《滚石》报道,Suno的CEO及联合创始人Shulman提到, “如果人们更加热爱音乐,更加专注于创作,培养更加独特的品味,这对艺术家来说显然是件好事。我们的愿景是希望创造一个有利于艺术家的环境。我们并不是想取代艺术家。”

Suno官网转载的《滚石》杂志特稿,图源:《滚石》杂志官网

Suno 希望”让十亿人比现在更多地参与音乐”,将音乐创作进一步大众化。

总的来说,Suno 的工作方式和 ChatGPT 等语言模型差不太多,将语料分解为token,学习数百万种用法、风格和结构,然后按需重建。基于大量训练数据,Suno便能根据提示“创作”词曲。

但这让AI学习音乐无比困难。Mikey Shulman提到:“音频不像单词一样独立,它是一种波,一种连续信号。“高质量的音频采样通常达到44khz或48hz,意味着每秒48000个token。他表示,如何以合理方式将音频切分供模型学习十分关键,未来也还有很长的路要走。

这个爆火全球的产品,背后的公司成立不到两年,目前有12名员工。联合创始人都是机器学习方面专家。一直到2022年,他们都在剑桥的另一家AI公司Kensho共事,专注于为复杂商业问题提供AI方案。

四人在Kensho的时候开发了一种技术,用于转录上市公司的财报电话。当时Shulman和同事们便开始关注AI音频的潜力。一开始还只是想做某种助听器,甚至想通过音频分析发现机器故障。

他们后来发布的第一款产品是名为Bark的文本转语音程序。但对Bark早期用户进行调查时,他们发现用户更想要一种音乐生成工具,这成为Suno诞生的缘由之一。

Suno V3版本可能还有诸多弊端,如生成音频的压缩感强,有些流派的作品创作效果不佳。但Suno的V4版本已经在路上了。

今天,AI生成音乐的玩家不只有Suno。Adobe的Project Music GenAI、YouTube的Dream Track此前都引起不少讨论,Suno目前生成的质量无疑“遥遥领先”。

大家似乎对版权都格外谨慎。Suno V3为了进一步防止音频被滥用,同时也开发了专有的不可听水印技术,可检测歌曲是否使用 Suno 制作。Dream Track由谷歌 DeepMind的Lyria音乐生成模型提供支持。谷歌表示,使用 Lyria 创建的曲目将带有肉耳听不见的 SynthID 水印,并且可以在修改曲目时保留。

图源:Suno

但Suno对自身的定位略有不同。当Dream Track允许用户使用像 Charlie Puth 知名歌手的声音创作音频时,Suno明确指出:Suno为原创音乐而设计,不允许用户在提示中指定任何特定艺术家的风格,同时也不会使用真实艺术家的声音。

另外,每次在Suno里编辑歌词时,都有点让人汗流浃背,Suno不厌其烦地说:要么AI帮你写,要么你自个儿写,除非你复制来的词有版权!

图源:Suno

不过,“高傲”的Suno,还未针对进行模型训练的数据来源进行说明。比起文字,音乐生成领域尚在很早的阶段。