最新消息显示,据知情人士透露,自从此前向OpenAI投资超过100亿美元开发人工智能模型之后,微软首次在内部开发一个全新、足够强大的AI大模型,以与OpenAI最先进的AI大模型竞争,并且挑战谷歌和Anthropic等公司的AI大模型。
这个新的AI大模型在微软内部被称为MAI-1,由前谷歌人工智能主管Mustafa Suleyman负责。Mustafa Suleyman之前的工作是担任人工智能初创公司Inflection的首席执行官,之后微软雇佣了该公司的大部分员工并支付了6.5亿美元,并于三月获得了该公司的所有知识产权。
据两名了解这项工作的微软员工称,微软的MAI-1 AI大模型完全独立,不会延用Inflection已开发的AI大模型,当然可能会以其他公司的数据为基础。

打开网易新闻 查看更多图片

知情人士称,MAI-1的规模将远远大于微软之前开发的任何开源模型,这意味着它将需要更多的计算能力和训练数据,因此成本也会更高。MAI-1将拥有大约5000亿个参数或设置,可以调整这些参数或设置来确定模型在训练期间学习哪些内容。相比之下,OpenAI的GPT-4拥有超过1万亿个参数,而Meta Platforms和Mistral等公司发布的较小开源模型则拥有700亿个参数。
MAI-1的开发意味着微软现在正在人工智能领域“双管齐下”,既开发可以廉价构建到应用程序中又可以在移动设备上运行的“小语言模型”,也开发更大、最先进的人工智能大模型。
值得注意的是,OpenAI目前是微软产品中所有人工智能聊天机器人的基础,可以自动发送电子邮件或快速总结文档,而MAI-1的开发也表明,微软打算在人工智能领域开辟一条独立于OpenAI技术的全新道路。一位知情人士表示,全新大模型的具体用途尚未确定,这将取决于其性能如何。
据称,为了训练新的AI大模型,微软已经预留了大量配备英伟达图形处理单元的服务器,并一直在编译训练数据集来改进模型。一位知情人士表示,MAI-1所使用的数据集包括了部分从以前用于训练较小模型的数据集中提取的数据,包括由OpenAI的GPT-4创建的文本,以及来自其他来源的数据,例如互联网上的公共数据。
一位知情人士表示,微软可能会在本月晚些时候的开发者大会上对新的AI大模型进行预览,具体时间取决于未来几周大模型的开发进展。