据第一财经「新皮层」报道,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。
根据公开信息,罗福莉硕士毕业于北京大学计算语言学研究所,研二时在自然语言处理领域顶级会议ACL 2019上发表8篇论文,其中两篇为一作。毕业后,罗福莉加入阿里达摩院机器智能实验室。期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。
2022年,罗福莉离开阿里,在DeepSeek担任深度学习研究员,参与了DeepSeek的MoE大模型DeepSeek-V2的开发。(第一财经「新皮层」)