复旦大学公布高考数学大模型评测结果讯飞星火、通义千问名列前茅完胜GPT-4o

近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测结果，其中讯飞星火和通义千问表现突出，分别在高考数学新I卷和高考数学新II卷中分列前两名，而GPT-4o则在两份考卷的评测中均位列第三。

复旦NLP团队表示，全新出炉的高考试题具备高度的独创性和保密性，是用来评测大模型的绝好评测集合。

在全国高考数学新Ⅰ卷中，通义千问和讯飞星火对14道数学客观题的准确率达到70%以上，大幅领先GPT-4o的57%，字节豆包、智谱清言、百川等大模型紧随其后，准确率超过50%，百度文心一言、腾讯元宝、Kimi等大模型准确率低于50%。

而在全国高考数学新Ⅱ卷的评测中，讯飞星火、通义千问、GPT-4o准确率均超过60%，字节豆包、GLM4、腾讯元宝紧随其后，正确率在55%以上；文心一言、kimi等其他国产大模型正确率在55%以下。

值得一提的是，数学能力一直是GPT-4o的重要能力模块。OpenAI在5月14日的发布会上推出GPT-4o时，曾特别强调其数学能力，并在现场演示了包含实时图像识别和语音能力在内的在线教学场景。

从复旦大学NLP实验室公布的评测结果可以看出，讯飞星火和通义千问对数学问题的深入理解能力、分析能力和推理能力已经超过GPT-4o，使其在高考数学试题的解答上具有更高的准确率。有网友幽默地评论道：“看来做数学题还是咱中国人的强项。”

复旦大学公布高考数学大模型评测结果讯飞星火、通义千问名列前茅完胜GPT-4o

复旦大学论剑数学之巅

首个AI高考“语数外”成绩单发布，AI也偏科!150满分数学最高75分

2024年高考数学难度学霸:三年高中白学了，学渣:三年啥也没学会

2024高考数学超145分，可破格进985大学，有35所高校可选择

1974年高考：千人晒太阳？打一字 #每天学习一点点

英语美文朗读《你我就像野草一样坚强》

首个AI高考全卷评测结果发布：数学全都不及格

收藏！收藏！2024高考查分时间汇总，愿金榜题名刻，霸气凌云霄，前程似锦绣！

AI高考成绩出炉，数学全不及格 AI高考成绩单发布，GPT-4o拿下第二名，普遍语文好数学不及格

最惨高考状元何川洋，高考659分被拒收，北大称坚决不收这样的人

455-2022年上海市高考数学题，第8题。分段函数的奇偶性

新高考位次法肯定是不准的，一定要学卢老师的一人一系数

2024年高考日语新旧题型分析对比！

黄亦玫就是个倒霉的高考生高考题有两道弯，黄亦玫避过了一个，掉到了另一个坑里。无条件对你好，一般都很

高考数学大题均分30分

2002年高考题，带“岛”字的城市名，没几个人能说超过4个？

454-2022年上海市高考数学试题，第9题。概率题

2024高考日语小作文分析，你能得多少分？

1955年高考题，3人3天吃3桶米，9人9天吃几桶？

高考真的能改变命运吗，当初班里的尖子生和差生，20年后现状如何

高考志愿同样分数，城市、大学、专业该如何选择！

复旦大学公布高考数学大模型评测结果 讯飞星火、通义千问名列前茅完胜GPT-4o

复旦大学 论剑数学之巅

首个AI高考“语数外”成绩单发布，AI也偏科!150满分数学最高75分

2024年高考数学难度 学霸:三年高中白学了，学渣:三年啥也没学会

2024高考数学超145分，可破格进985大学，有35所高校可选择

1974年高考：千人晒太阳？打一字 #每天学习一点点

英语美文朗读《你我就像野草一样坚强》

首个AI高考全卷评测结果发布：数学全都不及格

收藏！收藏！2024高考查分时间汇总，愿金榜题名刻，霸气凌云霄，前程似锦绣！

AI高考成绩出炉，数学全不及格 AI高考成绩单发布，GPT-4o拿下第二名，普遍语文好 数学不及格

最惨高考状元何川洋，高考659分被拒收，北大称坚决不收这样的人

455-2022年上海市高考数学题，第8题。分段函数的奇偶性

新高考位次法肯定是不准的，一定要学卢老师的一人一系数

2024年高考日语新旧题型分析对比！

黄亦玫就是个倒霉的高考生 高考题有两道弯，黄亦玫避过了一个，掉到了另一个坑里。无条件对你好，一般都很

高考数学大题均分30分

2002年高考题，带“岛”字的城市名，没几个人能说超过4个？

454-2022年上海市高考数学试题，第9题。概率题

2024高考日语小作文分析，你能得多少分？

1955年高考题，3人3天吃3桶米，9人9天吃几桶？

高考真的能改变命运吗，当初班里的尖子生和差生，20年后现状如何

高考志愿 同样分数，城市、大学、专业该如何选择！

复旦大学公布高考数学大模型评测结果讯飞星火、通义千问名列前茅完胜GPT-4o

复旦大学论剑数学之巅

2024年高考数学难度学霸:三年高中白学了，学渣:三年啥也没学会

AI高考成绩出炉，数学全不及格 AI高考成绩单发布，GPT-4o拿下第二名，普遍语文好数学不及格

黄亦玫就是个倒霉的高考生高考题有两道弯，黄亦玫避过了一个，掉到了另一个坑里。无条件对你好，一般都很

高考志愿同样分数，城市、大学、专业该如何选择！