打开网易新闻 查看更多图片

出品 | 虎嗅科技组

作者 | 王欣

编辑 | 苗正卿

头图 | 视觉中国

虎嗅注:本文为虎嗅 《AI星火》系列 第01篇稿件,《AI星火》系列聚焦AI各细分行业的头部公司,通过AI创业者的故事折射出他们对AI产业的共识与非共识。第一篇,我们来聊聊国内估值最高AI音乐工具公司的困境、突破与思考——当理想破灭,发现AIGC无法颠覆内容行业时,创业者该以什么样的心态继续下去?

DeepMusic(灵动音科技)创始人刘晓光,在清华大学就读时曾是清华校园歌手大赛中出镜率最高的人。当2009~2013年,刘晓光在清华舞台上一展歌喉时,台下不会有太多人想到,这位清华大学音乐圈的风云人物、化学系高材生,最终会成为一个AI创业者。

刘晓光身上有许多看似并不相关却聚在一起的标签:接连得到腾讯与GGV投资的AI创业者、清华大学化学系本博连读生、AIGC公司创始人、清华大学吉他社社长、发过唱片又写过代码……

面对虎嗅,刘晓光颇为幽默地回想起自己创业伊始:由于清华化学系曾诞生了完美世界创始人池宇峰这样的“创业明星学长”,这里也成为了游戏创业者的“沃土”。在刘晓光休学前,他听到最多的一句“系内吐槽”是:“清华化学系都该去做游戏。”

刘晓光并未选择游戏或者化学,他选择了音乐。

2018年,刘晓光成立了DeepMusic,在创业伊始,DeepMusic最早的方向是试图用AI生成旋律,此后逐渐向AI音乐解决方案、综合性AI工具进化。在创投圈,DeepMusic算是AI音乐这个小众赛道的“资本宠儿”。2018年创业不久后便拿到了清华大学学长李健、“华控基石”联合投资的天使轮投资。此后在2020年、2023年DeepMusic连续完成了A轮和A+轮投资,累计融资金额超千万美元,这是国内AI音乐赛道截至目前融资总额最高的创业项目。

影响刘晓光命运的关键节点发生于2016年。曾任清华大学吉他社社长的刘晓光机缘巧合加入了清华大学AI作曲小组,这是一个隶属于清华大学计算机系的兴趣组,几个组员试图用AI解决音乐创作的问题。正是基于清华大学AI作曲小组,刘晓光最终成立了DeepMusic。

一路走来,刘晓光的创业之路不乏危机。他经历过短视频平台冲击音乐产业的剧变,曾被第三方平台抄袭,还曾被大厂挖人、被音乐老炮欺骗。但最大的危机,来自于2020年的一次“惊醒”,当时得到腾讯投资的刘晓光看到了腾讯音乐的行业研究报告:平均每年有100万首新歌诞生,但全行业收入的80%都流向了最火的100首新歌。

“一个关键问题是:AI提升音乐创作效率,真能带来更多营收吗?”刘晓光告诉虎嗅,“2020年,当知道每年都有100万首海量新歌产生,对我来说犹如晴天霹雳。作为给音乐供应端提高效率的生产工具,供应端不需要你,那你的业务模式该是什么样的呢?”

这成为了DeepMusic转向的起点:从此前针对行业内B端用户,向更广阔的端市场进行探索。他开始转变产品逻辑,针对音乐爱好者,推出主打音乐创作“心流体验”的音乐创作工具。

2023年1月,DeepMusic开启AI音乐产品“和弦派”的内测,这是一款可以囊括歌词创、旋律、编曲、混音等多个环节的AI音乐工具。截至2024年5月,和弦派的用户总量已经突破10万人,成为目前国内用户总数最多的工具类AI音乐产品之一。据刘晓光透露,和弦派的用户中有50%音乐爱好者,20%音乐老师,30%专业音乐人,目前和弦派已经采取付费模式。

4月29日,“和弦派”2.0正式版上线,用户能在其中参与歌词构思、旋律构建、编曲设计、虚拟演唱直至后期混音的全过程,在用户编辑音乐过程中也实现了实时交互反馈的效果。

不过,摆在刘晓光面前的挑战依然存在。

理想主义者的阵痛期

2018年刘晓光创业初期,时值移动互联网创业热潮,人工智能还刚刚崭露头角,但已大有“为未来指明方向”之势。这让初创的DeepMusic迎来一个不错的开局:开始有更多人开始关心AI给音乐行业带来的机会。

2018年2月,拿到李健的天使轮投资,刘晓光只花了20分钟。巧合的是:除了李健在清华电子系熏陶出的技术直觉外,两天前《经典咏流传》节目找到李健,想要通过技术手段将四千首古诗词谱成曲子在节目播放,这样的批量生产非常适合用AI搞定,因此李健觉得AI音乐这件事情大方向是对的。

此时,DeepMusic主要的业务模式是,用研发的AI音乐工具,给一些专业音乐团队、影视公司提供BGM创作相关的服务。它最主要的收入来源,是一些音乐、影视行业的B端用户。

当时的AI技术生成人声较为勉强,但是已经能够满足BGM的需求。因此最开始DeepMusic也在考虑将AI生成短视频BGM作为重要的一个服务。

当时摆在DeepMusic面前的关键考题是:需要一边研究将技术转化为服务的道路,一边摸索音乐产业底层逻辑。脱胎于学术领域的他们,在此前没有任何音乐产业经验,因此对于这个难以捉摸的行业了解甚少。

“从2018年开始每天都在研究钱从哪赚到哪。”刘晓光说。这条路并不容易,那时的音乐行业极为不透明和排外,一些音乐老炮也不会跟他说实话,研究一年之后他对“AI+音乐”创业的底层逻辑有了一些新的想法。当时抖音、快手的崛起已经势不可挡,他们也开始跟短视频平台的人去聊通过AI生成更多BGM的可能性。

谁料,就在他们刚刚找到一些感觉时,却发现整个行业突然变天了。

2019年,异军突起的短视频平台给音乐行业分发逻辑带来剧变,腾讯、网易云等音乐平台在分发机制上拥有的绝对话语权,被势能强劲的抖音、快手逐渐蚕食。曾经用户没有别的选择,只能在这些音乐平台上听歌,平台在积累用户的同时,还能够做直播和音乐娱乐化的变现——这部分收入,占腾讯音乐的50%以上。在短视频兴起之后,《学猫叫》等神曲抢夺了用户更多的注意力。音乐平台的播放次数则被严重挤压。

那一年,随着短视频平台规则的不断调整,音乐产业的商业模式每隔几个月就会改变。在剧变之下,各路人马为在本就“为爱发电”的产业活下去,“会干一些特别恶心的事情”,“洗歌”——通过模仿抄袭热门歌曲的歌词、旋律来获得更高播放量,也应运而生。乱象之下,流行歌曲也越发良莠不齐,一些没什么音乐性的简单歌曲也能被推成爆款歌曲。

这对于“AI+音乐”带来的变化是明显的。从市场大环境看,对于AI快速生成短视频BGM等简单歌曲的需求迅速放大;但挑战随之而来,各大平台都开始琢磨这件事,甚至让行业变得乱象丛生。

2020年,腾讯、网易、快手等大厂也开始尝试投入AI音乐类产品。大厂通过投资并购来获取新技术向来不是什么新鲜事,灵动音也成为了他们的目标之一。

找到DeepMusic的投资方开始变多,这里面不乏一些公司此前的客户,这些平台客户的想法是:干脆“以投代买”,进一步降低成本。由于那时公司现金流紧张,刘晓光一度只能硬着头皮去谈这个“以投代买”的方案。好在后来他拿到了腾讯投资,拒绝了其他平台的投资意向。

谁料,就在拿到腾讯投资的第二天,DeepMusic员工就接到了猎头的电话,“以投代买”计策未成功的大厂试图挖人。不久后,又有平台开始抄袭他们的产品。

当短视频带来了旺盛的AI生成BGM需求后,DeepMusic这样的小公司并未因此获得更多生机,反而在一些平台型大厂眼中,“通过资本迅速复制DeepMusic的功能”才是捷径。

这引发了刘晓光的危机意识和思考。那一两年时间,刘晓光时刻关注该大厂“类似Suno”的AI音乐产品数据动向,“看看大厂在做什么动作,自己是不是该调整。”但现在他认为那种心态是踩了坑。因为最后,该大厂的AI音乐产品“干崩了”,并未跑出来。

到了2020年初,该大厂内部的AI音乐产品团队“曲终人散”。

本以为在竞对离场后,情况会有所好转。但2020年腾讯公开的一份产业报告,却让他们感觉“用一年来研究的行业和布局”白费了。

产业报告显示,2020年有100万首海量新歌产生,而在今年这个数量可能达到千万级别,这其中有20万首音乐的质量足够完美,但只有一万首有机会被用户听到,100首被用户反复听。而那100首歌曲赚了整个行业80%的钱。

国内音乐营收在500亿左右,其中有100亿分给创作者,大部分份流向周杰伦、林俊杰等专业歌手为代表创作的IP歌曲,一家制作公司从非IP歌手中拿到的最多是15亿——而AI音乐的天花板份额可能不会大于这个数字,并且不会带来增量,用户不会再为音乐掏更多的钱。这是一个供需关系极度失衡的存量博弈市场。

这意味着2018年支撑DeepMusic的创业想法之一——AI生成短视频BGM模式——算是竹篮打水一场空了。实际上,某短视频平台一年的BGM版权费用只在千万级别,这些音乐完全不需要AI生成,这是因为罐头音乐库有几十万首免费的无版权歌曲。

天花板太窄?那就换个赛道

当刘晓光意识到全球的BGM罐头音乐市场不到一亿时,他内心是震撼的。

“当你讲一个故事,这个事的天花板还不到一亿,那还创什么业啊?”刘晓光说。

但他也从这些数字里获得了答案。

“为什么明明知道只有100首歌能赚大钱,但新歌却依旧在爆炸性增长?”刘晓光思考后认为,这说明这个行业还有一些未被挖掘的隐秘需求:创作音乐并不是为了赚钱,创作本身就是一件能带给人愉悦体验的事情,就像爱写小说的人享受的是打磨故事的过程,通过AI一键生成小说可能对这些人来说是伪需求。

另一个数字加深了他的信心:国内至少有1.3亿人买过乐器,说明至少有十分之一的人对创作音乐是感兴趣的。在他粗略估算下,用户上限是1亿,核心用户2000万,月活上限2000万。而目前国内AIGC平台月活也已经达到了这个级别。

那么,如何打造一款产品,让用户通过音乐创作来获得乐趣呢?

曾经那句“清华化学系的人就该做游戏”的系内吐槽,带给他灵感。为什么不借鉴做游戏的方式去做一款音乐创作类产品呢?

2023年1月,他彻底改变了产品设计思路并推出全新产品——和弦派App。

就像游戏一样,这个产品更注重的是过程而非结果。刘晓光希望通过手机端一栈式服务,让用户能从每个音符的选择排列开始,体验创作音乐的心流状态,因此它并非是Suno那种输入文字后一键生成的AI音乐产品。

在确定好目标后,他又遇到了技术难关:如何让用户在创作音乐时能获得低延时的声音实时反馈?

这是因为:相比视频延时掉帧,几秒钟的声音延时更容易被用户感知且极为影响体验。而刘晓光希望,让用户在点击调整每个音符时都能收到实时反馈。在这方面,iPhone的做法是一直将音频线程作为第一线程,每个线程每秒回调50次,保证了声音画面一直同步,因此苹果设备的音视频体验安卓优于其他设备。在开发iOS音视频软件时,就可以直接调用苹果引擎的第一线程做同步。

而安卓设备却没有这种优势,因此要求开发团队用Rust语言重新搭建引擎,不同乐器带来的多重轨道也增加了这件事情的难度,经过一年时间他们终于搞定了这个40万Rust语言的引擎。从敏捷工程管控、产品开发到运营获客,他们也几乎都是从零到一去学习。

目前和弦派的商业模式有两点:一是作为音乐工具收费。二是像唱片公司那样,帮C端用户发行歌曲,获得播放量带来的结算分成。

移动互联网时代产品有两个不同本质的路线:提升用户体验Kill time或者是提升用户效率Save time。那时的杀手级应用大都二选一,要么将体验做到极致,要么将工具做到极致。AIGC的头部产品,Minimax的星野和月暗的Kimi也在Kill time和Save time的不同路线分岔。而和弦派则是两者皆有。

这是因为:刘晓光给产品的定义是AI音乐工作站,一款全方位辅助音乐创作的工具。但因为音乐创作本身就是一种体验感很强的事情,它也有着Kill time的体验属性。

在我们三个小时的交流里,他提到了74次游戏。他经常会跟做游戏的校友交流,因为游戏才是将Kill time体验拉到极致的产品。但他们的交流通常以“晓光,你来做游戏吧”开始,然后以“不行,我还有音乐理想”结束。

Kill time or Save time?AI时代的杀手应用可能会有全新的产品逻辑吗?

刘晓光认为,在音乐类产品上可能两者结合才是最好的通路。他一直在探索,但现在仍旧偶尔会感到迷茫、纠结:到底是应该按工具开发还是按照游戏开发?

他想过将RPG游戏跟AI音乐结合,也在思考用游戏的方式来重做自己的产品,或者真的直接做一款游戏。毕竟游戏有着高ARPPU,相比之下音乐工具用户付费意愿有限。

他的困境或许能代表当下很多的AIGC创业者:当理想破灭,发现AIGC无法颠覆内容行业时,该以什么样的心态继续下去?

是努力找场景实现PMF,还是继续改进技术以迭代更有想象力的产品?

在一次校友会上,他和一个基础大模型公司CEO聊了两小时,内容是关于脑科学、认知心理学等星辰大海的话题。

他们的共识是:通过脑电波的不同模态标注,能更好地体现出不同音乐带给人的情绪。或许在技术足够发达后,脑电波生成AI音乐会比目前的文生音频效果更好。而技术突破总能给产品带来更大的想象空间。