编辑部 整理自 凹非寺
量子位 | 公众号 QbitAI
接下来,到底什么样的玩家才能吃上AI大模型的红利?
诚如大家所看到的那样,即便是OpenAI这样的“顶流”刚发布了Sora,也未能对其他视频生成模型造成碾压性的冲击。
但遥想最初ChatGPT发布之际,不仅在全球范围内掀起一股技术新浪潮,更是吃了足足一年半以上的技术红利。
因此,站在现在这个时间节点,刚才的问题是值得深入思考一番。
而就在前不久的MEET 2025智能未来大会中,昆仑万维董事长兼CEO方汉便针对这个问题给出了他的答案:
AI大模型SOTA(State of the Art)的技术红利变得越来越短暂,也将逐渐消退。
AI大模型产品需要关注“新”与“好”,商业模式能够创新者将成为真正的赢家。
在现场,方汉基于昆仑万维自身发展和入局大模型多年的经验,以《智能边界:AI大模型如何推动应用创新》为主题分享了他的所见所闻、所思所想。
MEET 2025智能未来大会是由量子位主办的行业峰会,20余位产业代表与会讨论。线下参会观众1000+,线上直播观众320万+,获得了主流媒体的广泛关注与报道。
核心观点梳理
- 用户不关心内容是否由AI制作,他们只关心内容是否新颖和优质。
- 技术红利逐渐缩短,AI产品需要关注“新”与“好”,以用户为导向实现商业价值。
- AI公司需要从单纯的工具提供者转变为平台型企业,通过产品和商业模式创新来实现这一转变。
- 中国企业在算法优化和商业模式创新上投入更多精力。
- AIGC技术能显著降低创作成本,使弱势文化国家也能创作高质量内容。
(为更好呈现方汉的观点,量子位在不改变原意的基础上做了如下梳理)
昆仑万维的AI大模型发展之道
各位尊敬的来宾,大家好,我是昆仑万维的方汉,今天我来跟大家分享一下,我们公司在AI大模型这一波浪潮中间,从技术到产品,我们的动作和我们对产品的思考。
首先简单介绍下我们公司。
昆仑万维公司2008年成立,主要在中国做网络游戏的研发,2015年上市之后开始转型做出海互联网平台。
从2015年到2020年,主要是把国外老的互联网厂牌通过中国人强大的运营能力做大做强,其中包括全世界第三大浏览器Opera,还有海外的K歌软件StarMaker等,都取得了很好的成绩。
从2020年开始,我们开始做AI方向的大模型研发。2022年12月,我们发布了国内开源的第一个13B的中文预训练大模型。
目前我们有三大业务板块,AGI与AIGC业务、信息分发与元宇宙业务、投资业务。
我们在全球大概有4亿月活跃用户,海外收入占比89.7%。在全世界100多个国家和地区都有业务,在20多个国家有我们的办公室。
下面介绍一下我们在AI领域的布局。
我们从硬件算力层到模型层到应用层都有投入,其实我们最关注的还是模型层与应用层。
在模型层,我们有语言大模型、多模态大模型、3D大模型、视频大模型、音乐大模型。
目前技术指标最好的是音乐大模型,这是国内目前唯一一家能够跟国外音乐大模型Suno相媲美的音乐生成大模型。
应用层,我们在AI助手、AI游戏、AI短剧、AI音乐方面都有投入。
2022年12月我们在开源了13B的中文预训练大模型之后,2023年4月发布了一个千亿的天工1.0大模型。
2024年4月,我们发布了天工3.0,其中音乐大模型取得了行业SOTA。
2024年11月20日,我们发布了天工4.0 4o版和端到端的实时语音对话助手Skyo;11月27日,我们发布了天工4.0的推理版本o1。
我们的天工4.0 4o版本,端到端实时语音对话系统,主要是把语音对话模型的时延从原来外挂式的400毫秒降到100毫秒,这个对于C端应用是至关重要的。
天工4.0 o1版本是国内第一款具有中文逻辑推理能力的o1模型,其中一个系列也马上要开源。
这是我们的业务矩阵,在国内主要做AI搜索业务,在海外有AI游戏、AI音乐、AI短剧和AI社交等业务。
我们国内的AI助手的产品也升级了,包括高级搜索、天工彩页和天工宝典。
天工高级AI搜索功能是目前最懂金融、学术的AI搜索。
这是AI短剧平台SkyReels,它是全球首个集成视频大模型与3D大模型的平台。
值得注意的是,Sora已经正式对外发布了,但是你们可以看到,Sora本身还是一个生成式模型。
国内的生成式模型有一个问题,用它来做实际作品的时候,要有一个很经典的动作,术语叫“抽卡”,就是同一个场景要用同一个prompt可能要生成10个甚至上百个视频,从中间抽出一个可用的视频。
也就是说,可控性是一个非常亟待解决的问题。我们走的路线是用3D大模型进行生成,再通过视频大模型进行转绘,这样可以做到一次成片,这个对于视频创作者来说把可控性大大提高了,不仅能够极大降低用户的使用成本,甚至还能极大地降低制作时间。
这是AI音乐。
AI音乐的大模型使用的数据量将近2000万首训练数据,众所周知,人类有史以来总共才有4000万首音乐,我们大概用了一半的数据量。
目前我们在海外有面向C端的流媒体音乐平台Melodio和面向B端的创作平台Mureka。
此外,还有AI社交产品Linky,DAU已经超过50万。
SOTA技术红利将消退
下面是我们在做探索过程中的一些商业思考。
目前很明显AI大模型已经到了中场甚至下半场,企业选择何种商业模式来进行自己的产品研发和推广?这是一个很重要的问题。
首先,我觉得由于风险投资的差异,导致中美AI的创业环境的不同。
因为我们在海外做的业务非常多,现在全世界的AI创新企业只有中国和美国是最多的,但是中国的AI创业企业能够拿到的融资与美国同行相比,少非常多。
可以看到,海外AI创业公司还有一大部分在做基础架构,它们的B端应用,在医疗健康、法律、金融等方向比较多,中国企业反而可能2C、2B都比较多。
此外,Scaling Law到底有没有放缓?争论点非常多。但我觉得能够看到一个很明显的事实。
为何OpenAI推出4o?本质是因为训练的Scaling Law已经放缓了,但是通过慢思考推理的Scaling Law又继续涌现,所以你只要继续加大推理时间,模型能力就会上升,这是从产品角度倒推的一个事实。
SOTA的红利变得越来越短暂。
GPT3.5出来之后震惊全球,它的红利至少持续一年半以上,但是像Sora正式发布后,我看到很多评测对其提出了批评意见,比如,图生图做得比较差、人脸都生成不出来、文生图的可控性不好。
也就是说,Sora在正式发布之后,并没有表现出对同类的其他一些视频生成模型的碾压式的技术优势,这样导致了Sora的技术红利能不能像ChatGPT3.5那样持续很长时间?或者像Dalle3那样压根没有吃到红利?
在文生图时代,做得最好的是OpenAI的Dalle3,但是由于种种原因,最后市场上吃到红利的其实是Midjourney和Stable Difussion。
我认为,Sora有可能吃不到SOTA的红利。
中国的AI企业,除了拿不到更多投资,还存在一个问题,在算力上受到极大限制。我们能拿到硬件的算力是比较有限的。这样会倒逼两点。
首先,中国企业在算法迭代上有极大的动机和投入,例如,Sora第一版本训练用了将近5000—8000张卡,到中国第一个可用的视频生成模型算力是花了不到1000张卡,最新的一个开源生成模型可能只花了256张卡。
中国团队在算法的优化和迭代上所花的精力应该是美国同行的很多倍,因为没有办法,没有卡,这就是所谓的以软补硬。
同时,中国企业还有一个巨大问题,生存压力特别大。一部分AI企业得不到更多资金,另一部分AI企业即便能拿到资金,投资人对企业盈利的时间点和商业模式都有极高要求,所以中国企业都在思考,用AI如何快速地盈利?
大家可以看到,现在在全球市场上疯狂买量的AI企业一定是中国企业,因为所有的中国企业都在拼命地打磨自己的产品的盈利模式,而不是像美国同行一样有充足的资金去做更深层的工作。
AIGC技术能显著降低创作成本
下面跟大家分享一下,文化平权和多语言带来的蓝海。
还是以Sora发布为例,大家可以看到,Sora有一篇PR稿件标题叫《尼日利亚的Minna》,这是一个KOL,他用Sora创造了一个质量很好的视频。
正巧我也在尼日利亚待过很长时间,据我了解,在尼日利亚拍摄一部电影的平均成本大概是10万美金,不到100万人民币,这样导致尼日利亚当地根本没有能力创造出与美国电影,不要说美国电影,甚至连印度电影都比不上的一个高质量的内容。
所以像尼日利亚这样的亚非拉国家,他们能看的电影只有美国大片,为什么?因为美国大片平均的制作成本在1亿美金以上。
那么,中国的大片什么时候能与美国大片正面PK?何时赶上美国?中国的电影,票房上10亿之后、单部拍摄成本上亿之后,中国的电影才可以正面与美国电影PK。
到《流浪地球》这个级别,它的视听效果与美国相比已经没有差别了。这一切本质上都是用资金换来的。全球其他国家如果没有这个资金,就只能看强势文化的电影。
但是有了AIGC之后,包括内容生成,我相信以后单部大片的投资,从1亿美金的制作成本很快可以降到几百万人民币,甚至几十万、几千元人民币,这都是非常有可能的。
这样的结果导致所有国家、所有弱势文化地区都可以用AI技术来制作本国的内容。
与TikTok一样,全世界人民都是用手机创作属于自己的内容文化。我们认为AIGC技术的进步会极大降低所有人创作内容的门槛和所有人创作内容的成本。
这样全球创作者的规模,包括电影创作者、音乐创作者、电视创作者、短剧创作者都会急剧扩大,这对中国平台型企业而言一定是非常大的优势,这个过程中也会涌现下一代内容平台。
大家知道,去年AI公司里薪酬最高的是算法工程师,这个与我们最早进入互联网时代的时候一模一样,1995年一个程序员会写HTML,每个月可以挣一辆奥迪出来。
但是今天一个程序员只会HTML,每个月连一个车轮子都挣不出来,这就是技术的迅速弱化。
中国互联网最后真正赚到钱或者成长为巨头的企业,大部分都是靠商业模式创新取得了成功。
对于用户,他们根本不关心你的内容是AI做的还是人做的,只关心两个点,内容要么新,要么好。
例如,众所周知《黑神话》,这个游戏的质量非常高,花了几亿元人民币的成本、工业化的生产,创造出全世界一流的内容,这就是“好”。
对于其他没有这么多资金投入的企业来说,你的内容用户怎么会买单?那就要“新”。
再举一个例子,同样是游戏领域,像重庆有一家公司,5个人,100多万投入,最后做了一个戴森球计划,卖了8亿,就是在内容的形式上进行了创新。
我认为,对于AI产品来说,你只要关注你产品的形态是“新”还是“好”,这样用户才会买单。
对于大多数AI创业企业来说,产品形式上的创新才是击中用户的根本点,而不是说是不是AI、AI用了百分之多少。
对于所有AI创业企业来说,当下都处在比技术、比指标的阶段。我觉得绝大多数AI产品都是偏工具类的软件。在打造工具类产品时,一定要思考整个产品的宗旨是什么。
例如,在手机刚刚出现的时候,有很多企业做了很多视频工具、美颜工具,其中有一家做工具类产品的公司,最后成长为中国的一个短视频的巨头,他的产品叫“GIF快手”,就是把视频可以转成动画Gif,好在论坛上、聊天上去传播。
对于今天的所有AI公司来说,我们现在做的都是工具,但我们一定要想,我们的工具怎么样通过产品模式和商业模式的创新,成为真正的平台型企业,而不是一辈子做一个工具。
基本上对于所有AI公司都一样,要么去卷通用人工智能,要么通过AIGC为消费者创作更好的内容,让消费者可以通过AI降低创作内容的门槛和创作内容的成本,更好地塑造和表达自我。
我也希望在座所有企业家和从业者能够在AI时代大潮中抓住自己的时代红利。
谢谢大家!