打开网易新闻 查看更多图片

出品 | 搜狐科技

作者 | 郑松毅

运营编辑 | 王一晴

4月17日,在“天工”大模型一周年之际,昆仑万维宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测。

在媒体沟通会上,昆仑万维董事长兼CEO方汉介绍,“天工3.0”拥有4000亿参数,是目前全球最大的开源MoE大模型。

前日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,“开源模型会越来越落后”。谈及对开源模型的看法,方汉认为,开源模型和闭源模型的差距在不断缩小,其二者都是一个生态中的不同组成部分,不是谁压倒谁,大家都有自己的生存空间。

方汉说,“天工SkyMusic”是中国首个音乐SOTA模型,在全球AIGC领域处于领先地位。

谈及AI音乐大模型的应用价值,方汉认为,其极大地降低了音乐创作门槛,谱曲、作词、演奏等工作,现在一个人用AI模型就可高效完成。

大模型竞技已经持续了一年有余,很多人都在期待大模型“杀手级”应用什么时候出现?在方汉看来,AI手机是实现“杀手级”应用的一个前提条件。尤其在中国,使用手机App来解决大多数日常问题已经是一种习惯。要所有人都换AI手机估计还需要3至5年的时间。

以下为对话实录,经编:

媒体:昆仑万维在大模型训练方面有什么优势?我们知道大模型训练需要消耗大量算力,昆仑万维在算力储备方面是什么情况?

方汉:我们投入了大量资金进行算力采买,而且我们启动GPU采买的时间比较早,2022年七八月份就开始买,所以购买的价格是比较合适的。

可以说我们已经有接近万卡的训练资源,这在中国是位于前列的。我认为万卡资源足够支持下一代多模态大模型的训练。长期来看,如果遇到算力受限的情况,就要求你去优化推理和训练的算法。

媒体:“天工”模型都是开源的,对于“开源模型会越来越落后”的说法,您怎么看?

方汉:从大模型开始竞技到现在,我们可以看到开源模型和闭源模型的差距在不断缩小,而不是拉大。

在大模型评测榜单中,闭源模型的确还是第一,但开源模型与闭源模型的差距已从2023年的落后一两年,进化到现在是落后4到6个月。

开源模型实际上是一种生态构建器,更利于满足用户的长尾需求。我认识两个模型作者,一个基于Stable Diffusion做了给纹身师设计图案的模型,另一个给指甲店做了设计图案的模型。这两种长尾需求商业大模型是不可能满足的,只有靠开源大模型定制才可满足。

所以我个人认为开源大模型和商业大模型是一个生态中的不同组成部分,不是谁压倒谁,大家都有自己的生存空间。

媒体:您之前在发言中提到一个观点是“2024年是基础大模型的关键之年”,您觉得基础大模型接下来还会继续洗牌吗?

方汉: 我觉得任何事都应该是短期悲观长期乐观。洗牌每时每刻都在进行,向头部集中是任何一个行业的趋势。另外,我觉得接下来大家都会开始看重商业模式,即如何让大模型得到落地应用。因此,短期来看大模型厂商继续洗牌是一个必然的过程,也很正常。

媒体:现在大模型已经很多了,您对大模型“杀手级”应用的思考是什么?

方汉: 我觉得在中期应该是AIUGC平台快速成长,但最终影响所有人生活的一定是随身携带的设备,比如AI手机。

我认为AI手机是实现“杀手级”应用的一个前提条件,尤其在中国,使用手机App来解决大多数日常问题已经是一种习惯。要所有人都换AI手机估计还需要3至5年的时间。

媒体:国内大模型厂商似乎都在追赶OpenAI,您怎么看?您觉得将模型训练做得更好和追求商业化落地哪个更重要、更优先?

方汉:都在追赶OpenAI是一个事实,这个目标也是必然要达到的。

如果一定要比较,我觉得更重要的是要把大模型训练得更好,但事实上这两者并不矛盾。训练大模型是基础,应用落地是实现。基础打不牢,实现就做不了。

对我们来说,优先级更高的是对文本大模型底座能力的训练,因为这个决定了你能否在其他子领域取得SOTA红利,这个是非常重要的。