“我们不能高估一次技术革命的速度,也不能低估一次技术革命的深度和广度。如果基于大模型的通用人工智能(AGI,Artificial General Intelligence)技术有可能成为真正意义上的第四次工业革命,那么它将在未来几十年中,持续且深层次地影响人类生活的方方面面。”2024年6月13日,在第六届“北京智源大会”举办前一天,智源研究院院长王仲远告诉媒体。

打开网易新闻 查看更多图片

图丨王仲远(来源:资料图)

6月14日,智源大会正式举办,王仲远在会上宣布智源研究院推出大模型全家桶,并公开大模型全栈开源的技术基座新版图,同时还主持了一场围绕AGI的尖峰对话。

打开网易新闻 查看更多图片

(来源:资料图)

值得一提的是,大会邀请到OpenAI公司Sora和DALL·E的团队负责人阿迪蒂亚·拉梅什(Aditya Ramesh)和美国纽约大学助理教授谢赛宁,两者针对多模态大模型的技术路径和演化方向等内容展开对谈。

与此同时,大会也邀请到零一万物CEO李开复,中国工程院院士、清华大学智能产业研究院院长张亚勤,百度CTO王海峰等业内大咖,围绕AGI的话题发表演讲和参与对谈。

打开网易新闻 查看更多图片

(来源:资料图)

推出大模型全家桶,宣布全栈开源技术基座新版图

据介绍,智源研究院的大模型全家桶包括大语言模型、多模态大模型、具身智能大模型和生物计算大模型几个类别。

打开网易新闻 查看更多图片

(来源:资料图)

大语言模型系列包含全球首个低碳单体稠密万亿语言模型Tele-FLM-1T和通用语言向量模型BGE(BAAI General Embedding)系列。

前者主要用于解决算力缺乏这一产业界核心痛点,由智源研究院联合中国电信人工智能研究院,基于模型生长和损失预测等技术搭建而成。

后者则用于攻克大模型的幻觉问题,主要基于检索增强生成技术来实现数据之间精准的语义匹配,以更好地支持大模型对外部知识的调用。

多模态大模型系列包含:

  • 原生多模态世界模型Emu 3;
  • 轻量级图文多模态模型系列Bunny-3B/4B/8B。

前者采用智源研究院自研的多模态自回归技术路径,能够统一输入和输出文字、视频等多种模态,与那些能力单一的模型相比,具备原生统一的多模态能力。

后者专为智能端侧应用研发,模型架构灵活,既可以支持不同的视觉编码器,也能支持不同的语言基座模型。

在具身智能大模型方面,其则研发了如下产品:

  • 真机实验成功率超过95%的泛化抓取技术ASGrasp;
  • 在任务执行失败时能够重新思考并再度尝试的铰接物体操作大模型系统SAGE;
  • 既能根据指令要求将物体放到指定位置,又能对物体姿态进行精细化控制的六自由度物体拿取放置的大模型系统Open6DOR;
  • 能直接将机器人视角的视频和用户的指令作为输入,再端到端输出机器人移动控制信号的基于视频的多模态具身导航大模型NaVid;
  • 能在真人身上开展自主心脏超声扫查的智能心脏超声机器人;
  • 以及帮助智能体像人类一样完成计算机任务的通用计算机控制框架Cradle。

生物计算大模型则包含:

  • 全原子生物分子模型OpenComplex 2;
  • 实时孪生心脏计算模型。

前者不仅可以预测大分子的稳定结构,还具备初步预测分子多构型和折叠过程的能力,能够帮助科研人员深入探究蛋白质的生物学功能。

后者不但能仿真出一个“透明心脏”,还能基于患者的临床数据搭建出反映其个性化生理病理的孪生心脏。

大会上,智源研究院还发布大模型全栈开源技术基座FlagOpen 2.0,并分享了其在模型、数据、算法、评测、系统这五大版图上的布局。

目前,FlagOpen 2.0面向多种芯片、支持多种深度学习框架,有助于开发者一站式进行大模型开发和研究工作。

打开网易新闻 查看更多图片

(来源:资料图)

两场围绕大模型和AGI的大咖对谈

大咖对谈,是本次大会值得重点关注的环节。

在智源研究院理事长黄铁军的主持下,李开复和张亚勤围绕“AGI的关键问题和思考”展开了一场对话。

打开网易新闻 查看更多图片

图丨黄铁军(来源:资料图)

显然,大模型已经成为迄今为止AI发展得最成功的一个技术方向。

那么,究竟是什么原因,让大模型如此成功?

在李开复看来,人类通过更多计算和数据不断增加大模型的智慧,让大模型的规模定律得以实现,这本身就是推动大模型成功的一个重要原因。另外,接近无损的压缩也非常关键。

在此基础上,张亚勤补充了两个观点,认为基于令牌的统一表述方式和通用性,也是大模型成功的原因。

即便如此,目前的大模型也仍然面临诸多挑战。

例如:

其一,通过盲目堆算力的方式推动大模型性能提升,不利于该领域的长远发展。

其二,与人类大脑的高效相比,大模型的计算效率低下。

其三,大模型尚且无法真正理解物理世界,推理能力、透明性和幻觉问题还需要进一步研究。

其实,除了是一项优秀的技术,大模型也已经在诸多行业展现出它的应用潜力。

那么,它在走向产业化的过程中,会在To B和To C哪个赛道找到更大的机会?

“简单来说,在中国To C赛道短期更有机会,国外则两者都有机会。”李开复表示。

他认为,对于To C应用而言,AI 2.0时代会与PC及移动互联网时代相同,会先出现在生产力工具领域,接着出现在娱乐、音乐、游戏等领域,随后出现在搜索、电商等领域,最后出现在社交、短视频等领域。

打开网易新闻 查看更多图片

(来源:资料图)

另外,在王仲远的主持下,百川智能、智谱AI、月之暗面和面壁智能这四家大模型公司的CEO,也围绕“尖峰对话:通往AGI之路”展开了一场对话。

对于AGI来说,虽然目前学术界和产业界都在不遗余力地追求它的到来,但关于AGI的定义,却仍未出现一个广泛的共识。

对此,月之暗面CEO杨植麟认为:“AGI的定义是重要的,但不一定现在就要出现精确、量化的定义。它最重要的作用在于,让整个社会或所有人对接下来发生的事情有一个准备。”

百川智能CEO王小川表示:“之前我们谈AGI是把它当成工具来看。但现在的变化是,开始具备思考、学习、沟通等能力,甚至是多模态图片能力。如果真要设置一个标准,我认为人造医生就是AGI。”

面壁智能CEO李大海指出:“从经济学的角度讲,如果我们执行任何一个任务的边际成本都为零,那这就是我们理想中的AGI。”

智谱AI CEO张鹏则提出:“我更愿意相信AGI是一种信念、一个符号,它的内涵和外延是在不断变化的。在当前,我们的目标是以人为参照,让机器像人一样思考。当然,我们也期待它可以出现超越人的能力。”

而在此基础上,对于大模型是否是通往AGI之路的基石这一问题,四位CEO也基本都秉持赞同的态度。

打开网易新闻 查看更多图片

(来源:资料图)

让“AI春晚”越办越好,让中国AI越攀越高

在过去一年里,国产大模型取得了长足进步。在王仲远看来,当国产大模型达到GPT-4的水平之后,就能发挥出中国最擅长的场景和数据优势,真正变成一种赋能千行百业的新质生产力。因此,当下的国产大模型仍在技术端快速迭代。

业内有专家认为,该阶段不宜进行产品应用方面的开发,以免被新技术碾压。王仲远认为,该观点具有合理性。其中一个很重要的原因在于,如果大模型在技术水平还不够高的情况下,就急于进入垂直领域开发应用,那么最终的结果一定是被完全碾压。而当它的水平达到GPT-4之后,则可以尝试进入实际业务场景。

以大模型为代表的AI技术,既需要学术界和产业界紧密合作,也需要将研究出的成果转化为实际的生产力。而要想实现这一目标,生态建设必不可少。

通过举办智源大会来链接中国和全球的AI研究者,便是智源研究院构建生态的一种具体表现。据了解,本次大会汇聚200余位AI顶尖学者和产业专家,围绕中国大模型技术和产业发展,举办了20多场论坛,涉及到100次报告。

打开网易新闻 查看更多图片

(来源:资料图)

对于智源研究院和智源大会,李大海评价道:“我们非常期待在智源的撮合跟带领下,搭建一个更好的平台,把需要做好的事情一起协作好。也祝愿智源每年的年会像AI界的春晚一样,能够越办越好。”

展望未来,智源研究院也将继续从坚持原始技术创新、加强产业孵化等维度切入,不断地推动AI技术繁荣发展。