打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

5 月 29 日,Mistral 发布了首个用于代码的生成式 AI 模型——Codestral,并表示将致力于将 Codestral 集成到 LlamaIndex、LangChain、Continue.dev 和 Tabnine 等应用框架和开发环境中。

▍精通 80 多种编程语言的模型

Codestral 经过了 80 多种编程语言的多样化数据集训练,包括最流行的语言,例如 Python、Java、C、C++、JavaScript 和 Bash。它在 Swift 和 Fortran 等更具体的语言上也表现良好,广泛的语言基础确保 Codestral 能够在各种编码环境和项目中为开发人员提供帮助。

Codestral 为开发人员节省了时间和精力,它可以完成编码功能、编写测试并使用中间填充机制完成任何部分代码。与 Codestral 交互将有助于提高开发人员的编码水平并降低出现错误和错误的风险。

打开网易新闻 查看更多图片

尽管 Mistral 宣称该模型是开源的,但其许可证禁止将 Codestral 及其输出用于任何商业活动,仅适合于研究和测试等用途,并明确禁止员工在公司业务活动中进行任何内部使用,这一限制可能是由于该模型的部分训练数据涉及受版权保护的内容。有证据表明,Mistral 之前的训练集包含了受版权保护的数据。

▍生成代码的标准

Codestral 拥有 220 亿个参数,需要一台强大的 PC 才能运行。此外,与之前用于编码的模型相比,Codestral 在代码生成的性能/延迟空间方面设立了新标准。

打开网易新闻 查看更多图片

  • Python:使用四个基准测试:HumanEval pass@1、MBPP sanitised pass@1 来评估 Codestral 的 Python 代码生成能力、CruxEval 来评估 Python 输出预测,以及 RepoBench EM 来评估 Codestral 的远程存储库级代码完成;

  • QL:为了评估 Codestral 在 SQL 方面的表现,使用了 Spider 基准;

打开网易新闻 查看更多图片

除了 Python 之外,Mistral 还在六种不同的语言 C++、bash、Java、PHP、Typescript 以及 C# 中评估了 Codestral 在多个 HumanEval pass@1 中的表现,并计算了这些评估的平均值。

最新活动

1. 6 月 29 日周六 — 2024 世界 AIEC 峰会

2024 世界 AIEC 峰会即将在 6 月 29 日于无锡举办!首批合作组织已正式揭晓,新会员招募计划已正式启动,详情点击下方海报咨询:

2. 7 月 19 日周五 — AdventureX 黑客松大赛

如果你是 26 岁及以下具有开发、设计、营销三大核心能力之一的“当代嬉皮土”,这场 AdventureX 组织的线下黑客松活动不容错过!

这场今年最“硬核”的黑客松将在 7月 15~19 日在杭州良渚,你将在 5 天时间内组成2~4 人的小队,并在极限的时间内舍弃睡眠创造出你脑海中最疯狂的产品,或许下一个改变世界的产品就此诞生,访问: https://adventure-x.org 报名!

打开网易新闻 查看更多图片

最新资讯

打开网易新闻 查看更多图片