12月12日,在北京中关村科金技术有限公司主办的《2024大模型技术与应用创新论坛》,中国工程院院士、超算领域专家郑纬民发表题为《支持大模型训练推理的计算机系统研究与思考》的分享。

郑纬民院士表示,今年大模型有两个特点,第一是分析基础大模型进入多模态状态,不光有文本,还有图像、视频,也就是多模态。第二个特点是“用起来”。大模型+实际的东西,比如大模型+金融,大模型+医疗、大模型+汽车、大模型+智能制造、大模型+各行各业。

郑纬民院士提到,基础大模型,我们的水平跟美国人比差一点,但大模型+我们还是有希望超过美国的。

打开网易新闻 查看更多图片

他还讲解了大模型生命周期的五个环节,分别是数据获取、数据预处理、模型训练、模型微调和模型推理。郑纬民院士谈到,这五个过程都需要算力、存储,都很费时间。

谈到产业期待,郑纬民院士坦言,我们在构建国产万卡系统和异构卡联合训练方面还需要继续攻坚和努力。(定西)

本文来自网易科技报道,更多资讯和深度内容,关注我们。