ChatGPT中国数学题挑战！它能全答对吗？

Hello，大家好，我是大卫呆。

上期节目我给大家介绍了一下最近极其火爆的ChatGPT，以及不久的将来可能对我们的职业造成的影响。它不仅能回答各种生活问题，还能写宣传语、写代码甚至做数学题，而且支持中文！

今天咱们来个有意思的测试，我准备了5道小学水平的数学题，咱们看看ChatGPT到底能不能都正确的解答。

你说为什么只用小学水平的数学题？那是因为初中以上的题有很多的特殊符号，很难输入到文字框中。而且，如果ChatGPT连小学数学题都做不了也就不用考虑更难的题了。所以咱们先来看看它对小学数学题的解题能力如何。

话不多说，咱们直接上题。

第一题：7年前，妈妈年龄是儿子的6倍，儿子今年12岁，妈妈今年几岁。

我们来看看标准答案：

年龄问题，7年前，儿子年龄为12-7=5岁，而妈妈年龄是儿子的6倍，所以妈妈七年前的年龄为5×6=30岁，那么妈妈今年37岁。

接下来我们看看ChatGPT的回答对不对。

回答正确，而且解题思路也和标准答案几乎相同。

这是一道比较简单的数学题，但难点在于ChatGPT对于中文语义的理解。可以看到，它完全理解了中文语义并给出了正确的答案。要知道ChatGPT可是国外开发的程序，它的开发者可能都无法理解中文，但它却做到了。

当然也不排除ChatGPT背后也有中文大佬参与的可能性。

第二题：有一串彩珠，按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色？

还是先看标准答案：

周期循环问题，以2+3+4=9个一循环，600÷9=66....6，余数为6，所以第600颗是黄颜色。

再来看看ChatGPT的回答。

回答正确，解题思路也和标准答案相同。但注意这里ChatGPT出现了一个中文错字。

这道题的难度要比第一题大，如果只看问题，各位看文章的朋友们能答出来吗？ChatGPT不但要理解中文中的“红绿黄”，还要和数学计算混在一起才能解出正确答案，但它做到了。

第三题：建筑工地有一批砖，最上层两块砖，第2层6块砖，第3层10块砖……，依次每层比其上一层多4块，已知最下层有2106块砖，这堆砖共有多少块?

这回再次加大了难度，不但要理解中文每句话的逻辑及含义，还要根据这些内容加入数学计算。

我们还是先看标准答案：

根据题意设层数为n，A1=2，An=2106，D=4，

2106=2+（n-1）×4，

2106=2+4n-4，

4n=2106+2，

4n=2108，

n=2108÷4，

n=527，

（2+2106）×527÷2，

=1110916÷2，

=555458（块），

答：这堆砖共有555458块．

下面有请ChatGPT作答。

ChatGPT同样给出了完整的解题步骤，不过这次结果出错了。

可以看到ChatGPT在计算层数的时候就出现了错误，所以想让ChatGPT帮你做作业的朋友要小心了，答案不一定是对的。

第四题：把100根小棒分成10堆，每堆小棒根数都是单数，且一堆比一堆少2根，应如何分?

标准答案：

这是一个等差数列，Sn=nA1+[n(n-1)d]/2 ，所以100=10A1+10×9×2/2，解得A1=1

所以分成的10堆数量依次是1、3、5、7、9、11、13、15、17、19。

这次ChatGPT能答对吗？

ChatGPT回答正确。

最后第五题，我们加大难度，来个中文的逻辑推理题，我们看看ChatGPT的表现如何。

警方查询了三个可疑的人，这三个人中有一个是小偷，讲的全是假话。有一个人是从犯，说起话来真真假假，还有一个人是好人，句句话都是真的，查询中问及三个人的职业，回答是：

甲：我是推销员，乙是司机，丙是美工设计师。

乙：我是医师，丙是百货公司的业务员，甲呀，你要问他，他肯定说是推员。

丙：我是百货公司的业务员，甲是美工设计师，乙是司机。

请问这三个人中说假话的小偷是谁？

这道题对于ChatGPT不仅仅是逻辑问题，而且要非常熟练的理解中文的语法等含义，对于一个人工智能来，这可以说是中文里比较难的考验，我们看看它的表现如何。

首先标准答案是：

这是个逻辑推理题，关键是找到切入点，其中乙说的第三句话一定是真的，因为问甲甲的确是说自己是推销员，所以乙一定不是小偷，那么就分乙是从犯或好人两种情况来考虑，很容易就能判断出甲是小偷。

大家记住这个正确答案，下面有请ChatGPT作答。

ChatGPT的答案是甲是小偷，回答正确！而且我们仔细看它的解答也非常符合判断逻辑。说明ChatGPT不但理解逻辑，而且理解中文！

怎么样，你震惊吗？大家觉得ChatGPT的表现如何？

就我个人来评价一下，一共让ChatGPT做了5道中国小学水平的数学题，4对1错。正确率75%。由于测试样本只有5道题，所以也并不能说明什么问题，但至少能看出2点。

1. ChatGPT对于中文的理解非常让人惊叹，要知道中文在全球来讲都是非常复杂的语言系统，但一个人工智能竟然能顺利的答出中文的逻辑问题，确实让人惊讶。

2. ChatGPT真的可以用来做中国的数学题包括中文的逻辑推理题。虽然答错了一道，但可以看到ChatGPT的答题正确率很高，解题思路也基本都是对的。

但是，这里大家也不要觉得ChatGPT有多么神奇，上期节目已经让它自己解释了一下名字的由来。其中GPT缩写是来自Generative Pretrained Transformer。

而里面的“Pretrained”表示在模型被部署之前已经通过大量语料进行了预训练，以提高它的性能和泛化能力。也就是说"ChatGPT"是预先通过海量内容学习的。而我所找的小学数学题全部来自网上，所以并不排除ChatGPT的海量学习中包括我上面的几道题。而唯一答错的，可能是ChatGPT对中文支持的还不够完美或者题库中没有，当然也可能是本身算法上产生的问题。

但ChatGPT确实已经不仅仅是聊天助手这么简单了，它确实开始朝着科幻片里人工智能的方向在走，也许就在不久的将来，它就可以做到无论什么问题都能以人类的方式给你正确的答案，那必定会引起整个人类文明的巨大变化。您对此有什么看法，不妨在评论区讨论一下。

我是大卫呆，如果您觉得内容有用欢迎点赞、评论和转发，谢谢您的支持，我们下期见！

ChatGPT中国数学题挑战！它能全答对吗？

李毅教授怎么了？前段时间还那么风光，这就寻死觅活了。令人唏嘘

2025-2026年被定为中日韩文化交流年

独行侠三杀森林狼夺西决赛点东欧合砍66分

京东败给了这个时代，中产正在溃散

国务院任命华春莹为外交部副部长

中央督察组曝光市长赶赴现场

拜登在西点军校讲话：决心让美国士兵远离乌克兰战场

上海这座乐园成废墟探险地？实地探访：安全防护全无，逃票进场不绝

争议！曝印有红十字会标志的直升机，在户外给一群人送烤全羊

数字化还是折腾人？上海闵行部分学校推“智慧笔”惹家长吐槽

东部战区发布演习同框震撼画面大陆军人霸气喊话

学校通报教师课堂上向女生开黄腔

京东采销人员年薪从16薪涨至20薪业绩激励上不封顶

极氪回应“车主被锁车内打不开门”：机械解锁功能正常

中国防长董军将出席香格里拉对话会

没有奇迹！纳达尔0-3兹维列夫首次法网一轮游出局创多项纪录

大雨天保安抵住大门不让进男子对准保安一阵怒吼

伊朗宣布启动总统选举程序

深圳滨海大道总部基地段交通综合改造工程主线通车

卡德罗夫：正为泽连斯基准备地牢让其治疗后恢复理智

ChatGPT中国数学题挑战！它能全答对吗？

李毅教授怎么了？前段时间还那么风光，这就寻死觅活了。令人唏嘘

2025-2026年被定为中日韩文化交流年

独行侠三杀森林狼夺西决赛点 东欧合砍66分

京东败给了这个时代，中产正在溃散

国务院任命华春莹为外交部副部长

中央督察组曝光 市长赶赴现场

拜登在西点军校讲话：决心让美国士兵远离乌克兰战场

上海这座乐园成废墟探险地？实地探访：安全防护全无，逃票进场不绝

争议！曝印有红十字会标志的直升机，在户外给一群人送烤全羊

数字化还是折腾人？上海闵行部分学校推“智慧笔”惹家长吐槽

东部战区发布演习同框震撼画面 大陆军人霸气喊话

学校通报教师课堂上向女生开黄腔

京东采销人员年薪从16薪涨至20薪 业绩激励上不封顶

极氪回应“车主被锁车内打不开门”：机械解锁功能正常

中国防长董军将出席香格里拉对话会

没有奇迹！纳达尔0-3兹维列夫首次法网一轮游 出局创多项纪录

大雨天保安抵住大门不让进 男子对准保安一阵怒吼

伊朗宣布启动总统选举程序

深圳滨海大道总部基地段交通综合改造工程主线通车

卡德罗夫：正为泽连斯基准备地牢 让其治疗后恢复理智

独行侠三杀森林狼夺西决赛点东欧合砍66分

中央督察组曝光市长赶赴现场

东部战区发布演习同框震撼画面大陆军人霸气喊话

京东采销人员年薪从16薪涨至20薪业绩激励上不封顶

没有奇迹！纳达尔0-3兹维列夫首次法网一轮游出局创多项纪录

大雨天保安抵住大门不让进男子对准保安一阵怒吼

卡德罗夫：正为泽连斯基准备地牢让其治疗后恢复理智