据美团官方10月27日发布,美团正式发布视频生成模型LongCat-Video,这款13.6B参数的开源模型支持生成长达5分钟的视频内容,且画面连贯不"穿帮"。
据美团官方介绍,LongCat-Video不仅能根据文字描述生成视频,还能基于图片续写动态画面。演示视频显示,模型生成的滑板运动、特效变身等场景真实自然,AI特有的"塑料感"明显降低。
该模型在多项测评中表现优异,文生视频能力在开源领域达到顶尖水平,部分效果甚至接近谷歌的闭源模型Veo3。值得注意的是,其生成的长视频能够保持画面稳定性,解决了传统视频模型中常见的色彩漂移、动作断裂等问题。
LongCat-Video采用允许商用的MIT开源协议,这意味着开发者可以免费用于商业项目。Hugging Face高级主管在社交媒体上对此表示惊叹,称"中国团队竟然发布了一个MIT协议的基础视频模型"。
这是美团在AI领域的又一次跨界尝试。此前,该公司已陆续推出了语言大模型、语音编解码器等AI产品,从外卖平台逐步拓展至AI技术研发领域。美团表示,LongCat-Video是公司探索世界模型的第一步,未来将为自动驾驶、具身智能等深度交互业务场景夯实技术基础。