分享好友 资讯首页 频道列表

DeepSeek V3.2正式版发布:官方称推理比肩GPT-5

2025-12-01 23:5516450

凤凰网科技讯 12月1日,深度求索(DeepSeek)正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。官方网页端、App及API已同步更新至V3.2版本。

根据官方数据,在公开的推理基准测试中,DeepSeek-V3.2的推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,同时输出长度较Kimi-K2-Thinking显著缩短,以降低计算开销。V3.2-Speciale版本融合了DeepSeek-Math-V2的定理证明能力,在IMO、CMO、ICPC及IOI等多项国际竞赛中取得金牌成绩,其中ICPC成绩达到人类选手第二名水平。

新版本首次实现了思考模式与工具调用的融合,支持在思考过程中调用外部工具。通过大规模Agent训练数据合成方法,模型在1800多个环境和超过8.5万条复杂指令上进行了强化学习训练,提升了泛化能力。官方称其在智能体评测中达到当前开源模型最高水平,进一步缩小了与闭源模型的差距。

此前的实验版本DeepSeek-V3.2-Exp于两个月前发布,经用户反馈测试,其采用的DSA稀疏注意力机制在各项场景中未出现显著性能下降。Speciale版本目前以临时API形式开放,供社区研究与评测。

反对 0
举报 0
收藏 0
打赏 0
评论 0
中央网信办启动4个月专项行动 全面整治AI应用乱象 规范行业健康发展
中央网信办启动4个月专项行动 全面整治AI应用乱象 规范行业健康发展

0评论2026-05-011640

软银拟设AI新实体“Roze AI” 目标年内上市 估值千亿引内部质疑
软银拟设AI新实体“Roze AI” 目标年内上市 估值千亿引内部质疑

0评论2026-05-011093

蚂蚁百灵Ling-2.6-flash模型揭晓:高效推理,百万字长篇轻松生成
蚂蚁百灵Ling-2.6-flash模型揭晓:高效推理,百万字长篇轻松生成

0评论2026-04-232895

AI基建热潮涌动,ASM二季度业绩指引超预期,先进制程布局再深化
AI基建热潮涌动,ASM二季度业绩指引超预期,先进制程布局再深化

0评论2026-04-231268

零跑旗舰SUV D19正式登场!增程纯电双动力,豪华配置开启大型SUV新体验
零跑旗舰SUV D19正式登场!增程纯电双动力,豪华配置开启大型SUV新体验

0评论2026-04-161448

国家统计局:日均词元调用破140万亿,较上年末增40%
国家统计局:日均词元调用破140万亿,较上年末增40%

0评论2026-04-16852

Faraday Future与认购方修订协议 认购至1200万美元
Faraday Future与认购方修订协议 认购至1200万美元

0评论2026-04-162907