机器人大讲堂获悉,全球领先的多模态大模型公司「生数科技」近日完成发生工商变更,新增北京市工智能产业投资基金(有限合伙)为股东,注册资本也由原先的约147万人民币增加至约153万人民币。本轮融资完成后,生数科技的估值已达1亿美元。

打开网易新闻 查看更多图片

据机器人大讲堂了解,生数科技(全称:北京生数科技有限公司)成立于2023年,由瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化。自成立以来生数科技便一直致力于深入探索图像、3D和视频处理领域的原生多模态大模型的开发。秉承打造世界级的多模态大模型的目标,生数科技力图将文本、图像、视频和3D等多种模态信息融为一体,不断拓展生成式人工智能在艺术设计、游戏创作、影视制作和社交内容等领域的商业应用前景,增强人类的创意与生产效率,进而推动整个社会的创新发展。

在核心团队方面,生数科技团队成员主要来自清华大学人工智能研究院。此外,生数科技也汇集了众多来自阿里巴巴、腾讯、字节跳动等知名科技巨头的顶尖人才。这支团队在全球范围内享有盛誉,处于深度生成式算法研究的前沿,并特别擅长扩散概率模型的底层创新和研发工作,是该领域内少数具有国际领先地位的团队之一。

得益于雄厚研发团队实力,生数科技目前已于ICML、NeurIPS、ICLR等人工智能顶会发表相关论文近30篇,其中提出的免训练推理算法Analytic-DPM、DPM-Solver等突破性成果,获得ICLR杰出论文奖,并被OpenAI、苹果、Stability.ai等国外前沿机构采用,应用于DALL·E 2、Stable Diffusion等明星项目中。

在产品研发与业务拓展方面,生数科技的主要业务涵盖多模态大模型的研发,包图生文、图文联合生成、图文改写、把平面的图片内容生成为三维多角度可观的内容等。

打开网易新闻 查看更多图片

此前,生数科技已提出了基于Transformer架构的底层统一网络框架U-ViT,并在千万至数亿参数量级范围内验证了其强大的可扩展性。2023年3月,生数科技团队开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser,该模型的参数量不断扩展,体现了其在大规模训练技术方向的领导地位。此外,生数科技也发布了能够生成高清视频的文生视频模型Vidu,该模型能生成最长为16秒的1080P分辨率视频。

据天眼查显示,在此前,生数科技已总计进行过三轮融资,已披露融资金额总计超亿元,投资方包括蚂蚁集团、卓源资本、BV百度风投、卓源亚洲、锦秋基金、智谱华章、启明创投、达泰资本等知名企业和投资机构的投资。