分享好友 资讯首页 频道列表

AI大考高考数学:谁才是真学霸,DeepSeek等四款大模型满分夺冠

2025-06-11 12:4614310

在2025年高考期间,为确保考试的公平公正,国内多家知名AI大模型,包括腾讯混元、通义千问、Kimi和豆包等,主动暂停了图片识别问答功能。这一举措旨在防止高考生利用AI技术作弊。然而,这一做法也引发了一些讨论,有人认为这些企业对自家AI大模型的能力或许有些高估,因为之前的相关测试中,AI大模型在解答高考题目上的表现并不尽如人意。

尽管如此,随着2025年高考全国一卷的部分科目试卷公布,包括语文、英语和数学,媒体和公众再次将目光投向了AI大模型的能力。特别是对于数学科目,有人提出疑问:这些AI大模型能否像真正的学生一样,解答出高考的数学题目?

为了验证这一点,有人选择了六款AI大模型——DeepSeek、豆包、讯飞星火、文心一言、Kimi和通义千问,进行了一场别开生面的“高考”。测试环境允许AI大模型联网并使用深度思考功能,所选的数学题目涵盖了单选、多选、填空和简答等多种题型。

在第一题中,双曲线的离心率问题对于六款AI大模型来说似乎只是小菜一碟,它们全部得出了正确答案,并且给出了详细的推理过程。这一轮测试中,所有AI大模型都获得了满分。

然而,随着题目难度的增加,AI大模型之间的表现差异开始显现。在第二题中,关于三角形和正弦函数的问题让一些AI大模型陷入了沉思。豆包迅速得出了正确答案,而讯飞星火和通义千问虽然也最终得出了正确答案,但耗时较长。DeepSeek更是耗时接近10分钟才完成这道题目。

在第三题中,等比数列的问题对于大多数AI大模型来说并不构成太大挑战,除了豆包在输出答案时犯了迷糊,排除了一个正确答案外,其他AI大模型都迅速得出了正确答案。然而,在第四题中,一个关于数列和函数的复杂问题再次考验了AI大模型的实力。豆包、讯飞星火、Kimi、文心一言和DeepSeek依然表现出色,而通义千问则在这一轮测试中败下阵来。

经过四轮激烈的角逐,最终DeepSeek、讯飞星火、Kimi和文心一言以满分脱颖而出,豆包虽然因一时疏忽丢了三分,但依然展现出了强大的实力。而通义千问虽然在处理简单问题时表现出色,但在面对复杂问题时则显得有些力不从心。

这场“高考”不仅检验了AI大模型的实力,也让我们看到了它们在教育和辅导方面的巨大潜力。未来,随着AI技术的不断进步,学习机厂商和教育辅导平台或许可以与这些头部AI企业合作,共同推动AI教育硬件业务的发展,为学生提供更加高效、智能的学习辅助工具。

反对 0
举报 0
收藏 0
打赏 0
评论 0
2025中国光储品牌百强榜揭晓 宁德时代比亚迪等上市企业荣耀登榜
2025中国光储品牌百强榜揭晓 宁德时代比亚迪等上市企业荣耀登榜

0评论2025-11-202910

贝索斯再启航押注实体AI,与马斯克同赛道竞逐新未来
贝索斯再启航押注实体AI,与马斯克同赛道竞逐新未来

0评论2025-11-202481

充电设施达1864.5万个 2027年底将实现服务能力“三年倍增”
充电设施达1864.5万个 2027年底将实现服务能力“三年倍增”

0评论2025-11-202499

奕泰微:凭TSN车载以太网芯片突围,为智能网联汽车注入“芯”动能
奕泰微:凭TSN车载以太网芯片突围,为智能网联汽车注入“芯”动能

0评论2025-11-201028

东风汽车低空动力再突破:首台马赫2.0T飞行发动机交付,多款新品进展喜人
东风汽车低空动力再突破:首台马赫2.0T飞行发动机交付,多款新品进展喜人

0评论2025-11-201570

莲花Emeya独立测试显实力,13分35秒极速充电创电动车新纪录
莲花Emeya独立测试显实力,13分35秒极速充电创电动车新纪录

0评论2025-11-201561

特斯拉全球超级充电桩超75000根,V4桩上线助力充电网络升级
特斯拉全球超级充电桩超75000根,V4桩上线助力充电网络升级

0评论2025-11-202385

东风汽车低空动力再突破:首台马赫动力2.0T飞行发动机交付应用
东风汽车低空动力再突破:首台马赫动力2.0T飞行发动机交付应用

0评论2025-11-201914

武汉蔚能获6.7亿C轮融资,借资本东风加速电池资产管理领跑之路
武汉蔚能获6.7亿C轮融资,借资本东风加速电池资产管理领跑之路

0评论2025-11-201712

萝卜快跑关联公司于沈阳新设科技企业 聚焦人工智能等领域发展
萝卜快跑关联公司于沈阳新设科技企业 聚焦人工智能等领域发展

0评论2025-11-20955