分享好友 资讯首页 频道列表

AI大考高考数学:谁才是真学霸,DeepSeek等四款大模型满分夺冠

2025-06-11 12:4614990

在2025年高考期间,为确保考试的公平公正,国内多家知名AI大模型,包括腾讯混元、通义千问、Kimi和豆包等,主动暂停了图片识别问答功能。这一举措旨在防止高考生利用AI技术作弊。然而,这一做法也引发了一些讨论,有人认为这些企业对自家AI大模型的能力或许有些高估,因为之前的相关测试中,AI大模型在解答高考题目上的表现并不尽如人意。

尽管如此,随着2025年高考全国一卷的部分科目试卷公布,包括语文、英语和数学,媒体和公众再次将目光投向了AI大模型的能力。特别是对于数学科目,有人提出疑问:这些AI大模型能否像真正的学生一样,解答出高考的数学题目?

为了验证这一点,有人选择了六款AI大模型——DeepSeek、豆包、讯飞星火、文心一言、Kimi和通义千问,进行了一场别开生面的“高考”。测试环境允许AI大模型联网并使用深度思考功能,所选的数学题目涵盖了单选、多选、填空和简答等多种题型。

在第一题中,双曲线的离心率问题对于六款AI大模型来说似乎只是小菜一碟,它们全部得出了正确答案,并且给出了详细的推理过程。这一轮测试中,所有AI大模型都获得了满分。

然而,随着题目难度的增加,AI大模型之间的表现差异开始显现。在第二题中,关于三角形和正弦函数的问题让一些AI大模型陷入了沉思。豆包迅速得出了正确答案,而讯飞星火和通义千问虽然也最终得出了正确答案,但耗时较长。DeepSeek更是耗时接近10分钟才完成这道题目。

在第三题中,等比数列的问题对于大多数AI大模型来说并不构成太大挑战,除了豆包在输出答案时犯了迷糊,排除了一个正确答案外,其他AI大模型都迅速得出了正确答案。然而,在第四题中,一个关于数列和函数的复杂问题再次考验了AI大模型的实力。豆包、讯飞星火、Kimi、文心一言和DeepSeek依然表现出色,而通义千问则在这一轮测试中败下阵来。

经过四轮激烈的角逐,最终DeepSeek、讯飞星火、Kimi和文心一言以满分脱颖而出,豆包虽然因一时疏忽丢了三分,但依然展现出了强大的实力。而通义千问虽然在处理简单问题时表现出色,但在面对复杂问题时则显得有些力不从心。

这场“高考”不仅检验了AI大模型的实力,也让我们看到了它们在教育和辅导方面的巨大潜力。未来,随着AI技术的不断进步,学习机厂商和教育辅导平台或许可以与这些头部AI企业合作,共同推动AI教育硬件业务的发展,为学生提供更加高效、智能的学习辅助工具。

反对 0
举报 0
收藏 0
打赏 0
评论 0
尚世创展科技:以创新技术赋能沙盘模型,引领建筑智能新能源多领域展示新风潮
尚世创展科技:以创新技术赋能沙盘模型,引领建筑智能新能源多领域展示新风潮

0评论2026-03-312616

追觅科技:创始人俞浩遭恶意冒充,造谣者已被依法处理
追觅科技:创始人俞浩遭恶意冒充,造谣者已被依法处理

0评论2026-03-311038

长安蓝鲸超擎混动技术登场 城区油耗创新低 开启混动新篇章
长安蓝鲸超擎混动技术登场 城区油耗创新低 开启混动新篇章

0评论2026-03-311788

理想智能超充重点实验室揭牌 锚定技术高地赋能新能源电池升级
理想智能超充重点实验室揭牌 锚定技术高地赋能新能源电池升级

0评论2026-03-311798

中科宇航力箭二号首飞告捷,后续将加速推进可回收技术试验验证
中科宇航力箭二号首飞告捷,后续将加速推进可回收技术试验验证

0评论2026-03-312409

力箭二号成功发射轻舟初样试飞船 27个项目将开展在轨技术试验
力箭二号成功发射轻舟初样试飞船 27个项目将开展在轨技术试验

0评论2026-03-311497

安凯客车2025年度财报及董事会决议全览:利润分配与未来规划揭晓
安凯客车2025年度财报及董事会决议全览:利润分配与未来规划揭晓

0评论2026-03-311577

苹果“访达小人”成意外惊喜 助力MacBook Neo年轻市场推广
苹果“访达小人”成意外惊喜 助力MacBook Neo年轻市场推广

0评论2026-03-311052