惊了！国产大模型DeepSeek-V2悄然崛起： AI领域的黑马，技术领先，价格屠夫

深度求索推出 DeepSeek-V2：最先进的开源 MoE 模型！

亮点：

✅ 在 AlignBench 中排名前三，超过 GPT-4，接近 GPT-4-Turbo‍‍

✅ 在 MT-Bench 中排名前列，可与 LLaMA3-70B 匹敌，超过 Mixtral 8x22B‍‍

✅ 擅长数学、代码和推理‍

✅ 支持 128K 上下文窗口‍

特点：

✅ 创新的架构，拥有2360亿参数，其中210亿个活跃参数‍‍

✅ 无与伦比的 API 价格，同时保持真正的开源和非商业性‍‍

DeepSeek-V2 综合能力

在目前大模型主流榜单中，DeepSeek-V2 均表现出色

✅ 中文综合能力（AlignBench）开源模型中最强，与 GPT-4-Turbo，文心 4.0 等闭源模型在评测中处于同一梯队

✅ 英文综合能力（MT-Bench）处于第一梯队，英文综合能力（MT-Bench）与最强的开源模型 LLaMA3-70B 处于同一梯队，超过最强 MoE 开源模型 Mixtral8x22B

✅ 知识、数学、推理、编程等榜单结果位居前列

✅ 开源模型支持 128K 上下文，对话官网/API 支持 32K 上下文

价格背后都是技术‍‍‍

DeepSeek-V2最大的重点来了，上价格：‍

和一众友商比一下：

不要以为这只是个价格战，这个价格的背后都是技术，心动不如行动，吓得我连夜改API，这个价格你受得了吗？

模型架构

DeepSeek-V2 是一个强大、经济、高效的 MoE 语言模型，在注意力机制和稀疏层方面采用了卓越的架构设计：

MLA（Multi-head Latent Attention）：一种更好、更快的注意力，可通过减少 KV 缓存确保高效推理‍‍

DeepSeekMoE：一种新颖的稀疏架构，可通过稀疏计算以经济的成本训练强大的模型。

更多详情，请看技术报告和代码：

https://github.com/deepseek-ai/DeepSeek-V2

使用

与DeepSeek-V2聊天:

http://chat.deepseek.com

即用即付的DeepSeek-V2应用接口:

http://platform.deepseek.com

DeepSeek-V2完全开源，免费用于商业用途:

http://huggingface.co/deepseek-ai

⭐星标AI寒武纪，好内容不错过⭐

用你的赞和在看告诉我～

牛夫人

惊了！国产大模型DeepSeek-V2悄然崛起： AI领域的黑马，技术领先，价格屠夫

中文得分世界第一，多项盲测并肩 GPT4o，这个国产大模型怎么就成了 AI 界的黑马？

“离谱的AI扩图”火了！张张那叫一个出其不意

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

牛弹琴：欧洲看不下去了三国的联合举动狠狠打脸美国

温州一人从38楼跳下身亡！才25岁

哈佛拒绝向13名支持巴勒斯坦的学生颁发毕业证

媒体：为应对台海冲突美宣布"爱国者"导弹"下海"计划

华为智驾研发团队超7000人，有人感叹：遥遥领先真不是吹的！

太原赛：国乒5胜2负，钱天一惨败出局，日本小将一轮游，张本无奈

LPL迎来坏消息，冠军战队宣布解散，EDG重组新阵容，黑马扛不住了

讲真的，如果是我，宁愿饿死都不会去这样的企业奋斗

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

抗日女英雄，把日寇当成猪杀，被日军捅了两刀并活埋却安然无恙

男子坐星巴克店铺外的桌椅，刚坐下一分钟不到就被撵，你怎么看？

不懂编程的老板，组建了一支软件研发团队，结果坑踩了不少！

空警-600再次现身福建舰

有史以来最大！东契奇有资格在明年休赛期签下5年3.46亿超级顶薪

游客驾车碾压新疆一景区草场官方通报：行政处罚5000元，责令限期恢复植被

惊了！国产大模型DeepSeek-V2悄然崛起： AI领域的黑马，技术领先，价格屠夫

中文得分世界第一，多项盲测并肩 GPT4o，这个国产大模型怎么就成了 AI 界的黑马？

“离谱的AI扩图”火了！张张那叫一个出其不意

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

牛弹琴：欧洲看不下去了 三国的联合举动狠狠打脸美国

温州一人从38楼跳下身亡！才25岁

哈佛拒绝向13名支持巴勒斯坦的学生颁发毕业证

媒体：为应对台海冲突 美宣布"爱国者"导弹"下海"计划

华为智驾研发团队超7000人，有人感叹：遥遥领先真不是吹的！

太原赛：国乒5胜2负，钱天一惨败出局，日本小将一轮游，张本无奈

LPL迎来坏消息，冠军战队宣布解散，EDG重组新阵容，黑马扛不住了

讲真的，如果是我，宁愿饿死都不会去这样的企业奋斗

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

抗日女英雄，把日寇当成猪杀，被日军捅了两刀并活埋却安然无恙

男子坐星巴克店铺外的桌椅，刚坐下一分钟不到就被撵，你怎么看？

不懂编程的老板，组建了一支软件研发团队，结果坑踩了不少！

空警-600再次现身福建舰

有史以来最大！东契奇有资格在明年休赛期签下5年3.46亿超级顶薪

游客驾车碾压新疆一景区草场 官方通报：行政处罚5000元，责令限期恢复植被

牛弹琴：欧洲看不下去了三国的联合举动狠狠打脸美国

媒体：为应对台海冲突美宣布"爱国者"导弹"下海"计划

游客驾车碾压新疆一景区草场官方通报：行政处罚5000元，责令限期恢复植被