分享好友 资讯首页 频道列表

DeepSeek-V3.2及增强版发布:推理能力比肩GPT-5 工具调用能力再升级

2025-12-01 23:5521530

深度求索(DeepSeek)近日宣布推出全新开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale,同步完成官方网页端、移动应用及API接口的版本升级。此次更新标志着该系列模型在推理性能与工具集成领域取得重要突破,引发行业广泛关注。

根据技术白皮书披露,DeepSeek-V3.2在多项公开推理基准测试中展现卓越表现,其核心推理能力已与GPT-5持平,与Gemini-3.0-Pro的差距缩小至3%以内。特别值得注意的是,该模型通过优化输出策略,在保持信息完整性的前提下,将平均响应长度压缩至Kimi-K2-Thinking的65%,有效降低了计算资源消耗。这一改进使得模型在移动端部署时具备更强的实时响应能力。

长思考增强版V3.2-Speciale则聚焦复杂问题求解,通过整合DeepSeek-Math-V2的定理证明模块,在数学竞赛领域取得突破性进展。测试数据显示,该版本在IMO(国际数学奥林匹克)、CMO(中国数学奥林匹克)、ICPC(国际大学生程序设计竞赛)及IOI(国际信息学奥林匹克)等顶级赛事中均斩获金牌,其中ICPC项目成绩达到人类顶尖选手第二名的水平。技术团队透露,这一成就得益于模型对几何证明、组合数学等领域的深度优化。

技术架构层面,新版本首次实现思考过程与外部工具的无缝衔接。研发团队采用大规模Agent训练数据合成技术,构建了包含1800余个虚拟环境的训练矩阵,覆盖超过8.5万条复杂指令场景。通过强化学习训练,模型在智能体任务执行中的泛化能力提升40%,在开源模型评测中创下新高,与闭源模型的性能差距进一步缩小至12%以内。

两个月前发布的实验版本DeepSeek-V3.2-Exp已通过社区测试验证了DSA稀疏注意力机制的有效性。测试数据显示,该机制在长文本处理、多模态交互等场景中保持性能稳定,未出现显著精度损失。目前,V3.2-Speciale版本已通过临时API向研究机构开放,供开发者进行压力测试与场景适配。

反对 0
举报 0
收藏 0
打赏 0
评论 0
深圳超算携手沪AI实验室 构建一体化算力平台 赋能科研成果高效转化
深圳超算携手沪AI实验室 构建一体化算力平台 赋能科研成果高效转化

0评论2026-04-021423

华沿机器人港股上市超购5059倍 凭技术出海卡位协作机器人新蓝海
华沿机器人港股上市超购5059倍 凭技术出海卡位协作机器人新蓝海

0评论2026-04-022847

华为“克制式发展”:以硬件为基,聚焦主航道,筑牢AI时代根基
华为“克制式发展”:以硬件为基,聚焦主航道,筑牢AI时代根基

0评论2026-04-021598

从自动驾驶到具身机器人:隋伟揭秘AI芯片如何驱动智能技术跃迁
从自动驾驶到具身机器人:隋伟揭秘AI芯片如何驱动智能技术跃迁

0评论2026-04-02943

智谱GLM-5V-Turbo发布:融合视觉编程,多模态输入与复杂任务处理能力升级
智谱GLM-5V-Turbo发布:融合视觉编程,多模态输入与复杂任务处理能力升级

0评论2026-04-021570

2026中国工博会机器人展10月启幕,规模宏大助力行业创新发展
2026中国工博会机器人展10月启幕,规模宏大助力行业创新发展

0评论2026-04-022515

高德全量开源具身操作基座模型ABot-M0
高德全量开源具身操作基座模型ABot-M0

0评论2026-03-31603

iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场
iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场

0评论2026-03-252661

龙虾史上最大升级!但接了微信的千万别更
龙虾史上最大升级!但接了微信的千万别更

0评论2026-03-251135

美光2026财年第二财季营收238.6亿美元,第三财季营收预期再创新高
美光2026财年第二财季营收238.6亿美元,第三财季营收预期再创新高

0评论2026-03-201407