打开网易新闻 查看更多图片

作者 / 思考姬

以Chatgpt为代表的生成式AI的进化速度日新月异,令人恐惧。

最初它原本只用于和我们对话聊天,短短几个月,它已经成为了高不可攀的全领域艺术家:写文、文生图、文生视频?现实与虚拟世界的边界逐渐模糊,这并不只是好玩。

焦虑和不安在不断蔓延。

而原本具有更高的创作门槛的音乐领域,也将要沦陷了。

美国AI初创公司Suno,在3月22日公开了其AI作曲服务“Suno”的V3版本,该模型不仅可以一键作曲,还是“电台级品质”( radio-quality music)。

打开网易新闻 查看更多图片

Suno,印地语中意为「倾听」

尤其是其人声演唱效果舒适得令人不禁沉浸。

打开网易新闻 查看更多视频
AI音乐技术爆炸,猥琐发育,连《海贼王》作者尾田也忍不住诱惑?

​​​​​​​​​​​ 官方发布,让Suno制作一首“make a song that feels like falling in love”

AI音乐技术爆炸,猥琐发育,连《海贼王》作者尾田也忍不住诱惑?

官方发布,让Suno制作一首“Make a song for a S unday study session ”

但似乎是吸取了此前生成式AI服务在面世时所面临的口诛笔伐的经验,Suno当下是以一中小清新的风格在圈子内默默种草的。

Suno首页,大幅的标语提示着用户简单至极的作曲方法。只需几个简短的提示词(支持包括中文的多种语言),就算完全不懂乐理的小白,也可以在几秒钟内制作完整的、两分钟的歌曲。

SUNO创作基础页面极其简洁
打开 自定义模式可以进行更多配置

对于提示词,官方表示,你只需要描述一下想要的音乐风格主题就好了,这意味着你根本不需要谱写和编曲技巧,甚至没必要搞懂节拍、节奏、和弦、调性等等基础音乐知识。

下面是在提示框中输入:创作一首关于“迫不及待想再次见到你”的情感的韩国流行歌曲(kpop)后,Suno创作的一首音乐——

歌曲名称、歌词全部由Suno生成

下面这首增加了笔者随意写就的歌词,然后在提示框中输入:一首关于冰冷的都市中感受到孤独的一首华语流行歌曲——

歌曲名称、歌词由笔者编辑过,其他全部由Suno生成

两首歌曲一生成出来,笔者确实第一时间受到了冲击,它们拥有“令人不安的逼真”的演唱声音,有着自成体系的旋律,甚至前者自动生成了歌曲标题和歌词……一种“点石成金”的爽快感觉在笔者内部暗暗增长,开始欲罢不能地又创作了几首,还是不能尽兴。

歌名:《没有办法啦 我们要被AI取代啦?》
在被Suno震慑到后,笔者焦虑填词之作


01

让作曲民主化,但也做好了被诉讼的准备?

本次评测具有一定的主观性质,但是作为一枚资深听众和音乐爱好者,Suno这次带给笔者的作曲体验,确实有一种高深的艺术门槛降至“寻常百姓家”的解放感(暗暗的恐惧感暂时被shocked遮盖)。

有趣的是,Suno官方的公关态度也踩准这个点上。

打开网易新闻 查看更多图片

滚石杂志3月17日发文
《音乐界的ChatGPT来了。深入了解Suno,这家改变一切的初创公司》

Suno团队在《滚石》杂志中公开表示,他们的愿景是一个音乐创作大为民·主·化的世界。

其联合创始人迈克·舒尔曼直言,目前音乐听众数量远远超过音乐创作者的事实是“如此不平衡”的,而Suno则可以解决这种看似失衡的情况 ,而他设想未来全球有十亿人会每月支付10美元使用Suno创作歌曲。

Suno最早投资者之一安东尼奥·罗德里格斯认为Suno将能够在互联网上提高成为创作者而不是消费者的人数标准。Suno会让十亿人对音乐的参与程度比现在更高,而使用Suno会让人们从单纯的听众身份解放出来,并发展出创作者视点,更进一步的话,也许还会发展出独特的创作品味,而这“显然对艺术家来说是有利的,因为听众的音乐素养提高了。”

当下,免费用户每天可以使用Suno作曲10次,每次作曲将同时生成2首歌曲供用户选择,每天最多可以生成20首歌曲。

在版权归属上,由于所有由Suno生成的音乐都是由用户输入生成的,付费订阅者会拥有由Suno生成的歌曲的版权。但是,Suno会保留免费用户创作的歌曲的所有权。

虽然Suno团队标榜其是要增加创作者,而并不是要取代艺术家,但在具体的安全性和版权问题上,Suno的官方措辞变得拘谨。

团队对于其模型训练的使用数据三缄其口,投资者人之一的罗德里格斯对投资Suno所面临的法律风险有着充分的心理建设,甚至在投资之前他就做好准备了。他甚至仍然如此坦言:“如果Suno刚刚起步的时候已经与唱片公司达成了某些版权协议,我可能就不会投资了”,他认为Suno团队在没有与唱片公司达成交易的情况下就进行“自由”开发的风险,是值得冒的……看来,也许Suno也无法回避当下openAI面临的问题,即因ChatGPT在其庞大的训练数据中使用了书籍、新闻文章和其他受版权保护的材料而面临多起诉讼。

当下,虽然Suno已经在使用界面内,一直提示用户无法使用某位具体艺术家的提示词,或者模型不会识别对其他艺术家的引用并给出有效创作,但是在Suno的广场界面,笔者依然可以看到一些用户运用某位艺术家的提示词得到的一个近似的声音结果,比如初音未来。

Suno页面提示:不要引用某位具体的艺术家或歌曲

Suno广场上一位使用者的提示词,而其生成的歌曲中,确实有一段演唱与Miku有类似的声音

02
如果普及,哪些人要小心了?

Suno模型到底是如何取得突破性进展的?

其实一开始与音乐毫无关系。

Suno团队成立仅两年。其联合创始人舒尔曼、弗雷伯格、库克斯科和卡马乔,原本都是机器学习专家(machine-learning experts),最初他们曾一起在一家名为Kensho Technologies的公司工作,该公司专注于为复杂的商业问题找到人工智能解决方案。

在Kensho,这四人曾致力于攻克一种用于记录上市公司财报电话的转录技术(就是将上市公司的财报电话会议实时转录成文字),但因为音频质量不佳、术语丰富且口音各异等问题,这项任务棘手极了,也是在这一过程中,四人开始对人工智能音频在当时还未被开掘的巨大潜力产生兴趣。

2023年4月,他们产生突破性进展,一个名为Bark的文本转语音程序面世(开源而且免费)。

Bark擅长模拟人类语音的音调、语调和节奏,用户在其中可以输入文本,并选择音色、语速等参数,最终生成的语音听起来非常自然和容易理解,它也是目前为止最出色的文本转语音程序。

但接下来团队通过用户调查发现,用户更希望Bark能用来创作音乐。这一点激励了他们,以及正好团队中的舒尔曼和卡马乔都是音乐家——团队的音乐基因、机器学习基因在此刻发生化学反应,于是大家一拍即合决定彻底转向音乐生成领域。

团队曾在采访中表示,Suno采用了与ChatGPT等大型语言模型相同的一般方法,即将人类语言分解为称为标记的离散段,吸收其数百万个用法、风格和结构,然后根据需要重新构建它。但是音频,特别是音乐,几乎无法估量地更加复杂,因为音频不像单词那样是离散的东西。团队坦言,Suno能够生成令人信服的人类唱腔的部分原因,是它从语音录音中学习,而不仅仅是音乐。这表明Suno就是从Bark中得到发展的。

除了逼真的人类唱腔,Suno创作的歌曲的另一个特点,就是偏向“口水歌”。

什么是口水歌?

这可能是一个褒贬兼具的词。在中文互联网定义中,它指那些传唱于大街小巷中的、受众不分老幼、不一定写得很好但朗朗上口,容易被传唱的那些流行歌曲。

而从乐理角度理解口水歌的话,则可以说它们通常具有简单易懂的乐理结构。例如明晰的节拍,好懂的节奏;简单易记的旋律,常见的音程、且在整首歌中反复出现;简单的和声、和弦结构;大众化的主题表达等等。

这样的形容会让你想要周围的哪些歌曲?或者,哪些音乐创作者要警惕了?

短期内,最直接受到威胁的,似乎就是同样对歌曲有着“朗朗上口”要求的一个利润丰厚的市场:广告或电视节目的歌曲市场

专门负责经营和管理知名音乐人、制作人和创作者的Milk and Honey公司,其创始人卢卡斯·凯勒针对Suno的表现在滚石杂志的受访中表示:虽然他们主营的知名歌曲经营市场(the market for placing well-known songs )还未受到影响,但Suno未来可能会使得许多广告公司、电影制作公司、网络等无需再去从唱片公司等获取音乐版权授权了。


03
普通人/动画人怎么面对比较好?

面对生成式AI的这种恐惧的进化速度,大家应该已积累了很多焦虑。

实际上,去年Suno就曾经在ACG界引起过一场类似“咕咚来了”的故事 。

2023年12月,海贼王为庆祝动画25周年,官方X账号上发布了内容是一首由《海贼王》作者尾田荣一郎制作,发送给其漫画编辑的歌曲。 曲子标有Suno水印,也就是说,这首歌曲是由AI创作的。

打开网易新闻 查看更多图片

“尾田先生发送给负责编辑的一首原创歌曲……!
题目好像是「YO-HO-HO我们海贼」”

这立刻引起了大量AI反对者的不满,人们在评论区发表控诉言论,起初反对者只是针对尾田使用AI,但是传着传着,事情却变为“《海贼王》重制版要使用AI”,而且引起了一股抵制《海贼王》重置版的风潮——虽然这一切只是可能因为尾田图个新鲜。

AI的突破性进展,让我们连正视一股股焦虑情绪的时间都不够用了,杯弓蛇影成为了一种简单粗暴的又好像有效的面对方式,但它仍无法从根本上消除我们的焦虑。

我们当然可以仍然秉持着科幻作家特德·姜对ChatGPT的那种藐视感——“ChatGPT是网上所有文本的模糊图像”——但面对真正日新月异、已经不可停止的生成式AI技术的蔓延,我们可能真的只有真正尝试去上手,去感受,去熟悉,去表达,才能消除它为我们带来的种种具体的焦虑,和应对其可能带来的影响。

它可能真的依然是一个玄学又模糊匹配需求的工具,但我们可以通过了解它,来细致入微地批评它。

放眼当下,Suno的宣发仍然是一副小清新的姿态,并且其创始人也表示,使用的用户似乎更感兴趣的只是将他们的歌曲发给几个朋友。甚至笔者在赛博端发现的零星音乐专业人士的回复,也意外地并没有流露危机感,例如下图:

“作为一名音 乐家,我很高兴有人指出Suno可以作为一种技术性、全面的音乐工具来使用。 我现在利用Suno为朋友和家人定制音乐,根据他们的请求来创作。 这些不是为广泛听众设计的通用陈词滥调。 它是他们的。 是关于他们的。 它对歌曲的作用,就像Pandora等服务对个性化广播电台所做的那样。 反过来,它也为我构建了一个播放列表,每首歌都反映了我所关心的某个人。”

当然另一方面,则是大多数“AI艺术家”的狂欢,已经熟练掌握了图像生成类技术的他们,这下子连配乐都可以自己一手搞定了。

最后,仅就笔者个人而言,在想要用Suno去创作更精准对味的歌曲的背景下, 不可避免的需要重新开始复习已经生疏的乐理知识,掌握节拍,节奏,调式,和弦等等定义,才能去输入更加精确的提示词。

但令人啼笑皆非的是,在笔者在尝试了越发精确的提示词(比如节拍、人声、器乐等)之后,Suno的创作结果却经常不合理想,整体质量反而不如笔者在文章开头使用的最简洁的“一首关于×××的歌曲”的提示词生成的结果,这真是令人分裂。

当然,某种程度上,焦虑也减少了。

结语

这可能是人类史上,最需要让人类像机器人一样抛弃情绪,接受现状的时刻了;但另一方面,只有更具人性,才能更好驾驭生成式AI,而不是被它们所驾驭,让人类的感性随波逐流。

这真是矛盾至极。

你我都不容易。

— 点击图片阅读更多精彩内容 —