分享好友 资讯首页 频道列表

DeepSeek新模型DeepSeek-V3.2-Exp上线,引入DSA机制,开源双版本算子还降价

2025-09-30 08:3428580

人工智能领域再掀波澜,DeepSeek最新推出的V3.2-Exp模型正式上线,引发行业广泛关注。这款基于V3.1-Terminus版本升级的新模型,不仅在架构设计上实现突破,更在性能优化和成本管控方面取得显著进展。

核心技术创新方面,新模型引入的DeepSeek Sparse Attention(DSA)稀疏注意力机制成为最大亮点。该机制通过细粒度注意力分配,在保持模型输出质量的同时,大幅提升了长文本处理效率。据技术文档披露,在处理128K长度上下文时,新模型的解码阶段推理成本较前代版本降低明显,尤其在需要处理复杂逻辑的长文本场景中表现突出。

性能对比测试显示,V3.2-Exp在多个公开评测集上的表现与V3.1-Terminus持平。作为V3.1的强化版本,后者已在稳定性、工具调用准确性、语言一致性等维度完成多轮优化。新模型在继承这些优势的基础上,通过注意力机制创新实现了效率与效果的平衡。

在技术实现层面,研发团队采用TileLang高级语言进行算子原型开发,最终形成TileLang与CUDA双版本开源方案。这种分层实现策略既保证了开发阶段的调试便利性,又通过底层语言优化实现了生产环境的性能提升。官方特别建议研究机构优先使用TileLang版本进行实验,以提升开发迭代效率。

商业策略调整方面,DeepSeek同步推出API服务价格优惠,降幅达五成且立即生效。该举措覆盖官方App、网页端及小程序全平台,配合模型升级形成完整的产品服务矩阵。目前用户可通过HuggingFace和ModelScope平台获取新模型资源,相关技术论文也已在GitHub开源仓库公布。

行业动态显示,头部企业间的技术竞赛持续升温。有消息指出,智谱科技即将推出GLM-4.6模型,其产品矩阵中GLM-4.5已被标注为"上一代旗舰"。这种代际更替速度反映出AI领域激烈的技术迭代压力,某企业GitHub页面甚至以幽默方式回应研发节奏:"国庆是休息日,请给团队一点时间",侧面印证了节前技术冲刺的行业现象。

反对 0
举报 0
收藏 0
打赏 0
评论 0
极智嘉携手华通丰田,AI+机器人赋能汽车零部件仓储高效数智化转型
极智嘉携手华通丰田,AI+机器人赋能汽车零部件仓储高效数智化转型

0评论2026-05-092872

黄仁勋谈AI革命:中美竞赛高风险,工程师责任与机遇并存
黄仁勋谈AI革命:中美竞赛高风险,工程师责任与机遇并存

0评论2026-05-092826

DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈

0评论2026-05-01795

中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战
中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战

0评论2026-05-012894

农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代
农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代

0评论2026-05-01725

贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级
贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级

0评论2026-05-012318

乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?
乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?

0评论2026-05-012382

OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端
OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端

0评论2026-04-232891

消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场
消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场

0评论2026-04-232728

阿维塔06T全场景运动轿车上市:21.99万元起
阿维塔06T全场景运动轿车上市:21.99万元起

0评论2026-04-232690