分享好友 资讯首页 频道列表

DeepSeek-V3.2-Exp模型开源发布,华为云适配,官方API价格直降超五成

2025-09-30 08:349110

DeepSeek-V3.2-Exp模型近日正式登陆Hugging Face平台并全面开源,标志着该团队在下一代大模型架构研发中迈出关键一步。这一版本在继承V3.1-Terminus架构优势的基础上,首次整合了团队自主研发的DeepSeek Sparse Attention(DSA)稀疏注意力机制,通过动态调整计算资源分配,显著提升了长文本场景下的训练与推理效率。

据技术文档披露,DSA机制通过智能识别文本中的关键信息节点,构建局部-全局混合注意力网络,在保持模型性能的前提下,将计算资源消耗降低了约30%。实验数据显示,在处理16K以上长序列时,该机制可使推理速度提升22%,同时维持98.7%的原始准确率。华为云技术团队已完成与该模型的深度适配,现支持最高160K字符的上下文窗口,为法律文书分析、科研论文解析等长文本应用场景提供技术支撑。

伴随技术突破的是服务成本的实质性下降。DeepSeek官方宣布即日起全面下调API调用价格,降幅超过50%,新定价体系已同步至官网、移动端应用及小程序平台。此次调价后,该模型在同等性能区间内形成显著价格优势,特别在长文本处理场景中,单位token成本较前代产品下降62%,为中小企业和开发者提供更具性价比的解决方案。

技术专家指出,DSA机制的引入不仅优化了计算效率,更通过稀疏化设计减少了模型对硬件资源的依赖。在华为云昇腾AI集群的实测中,搭载DSA的V3.2-Exp模型在保持每秒3200 token生成速度的同时,将GPU内存占用从48GB压缩至32GB,这种优化使得单卡可处理更长的文本序列,有效降低了分布式训练的通信开销。

目前,开发者社区已涌现出基于该模型的长文本摘要、多轮对话生成等创新应用。某金融科技公司利用升级后的模型,将季度财报分析时长从4小时缩短至1.2小时,准确率提升至99.3%。随着生态工具链的完善,预计未来三个月将有超过200个垂直领域应用完成适配。

反对 0
举报 0
收藏 0
打赏 0
评论 0
杭州煊荣科技:6G引领通信革新 构建智能安全无缝的全球通信新生态
杭州煊荣科技:6G引领通信革新 构建智能安全无缝的全球通信新生态

0评论2026-06-232429

LG牵手英伟达加速AI机器人布局,产业链核心环节投资机会全解析
LG牵手英伟达加速AI机器人布局,产业链核心环节投资机会全解析

0评论2026-06-231069

2026人工智能+广电视听创新应用大赛启幕 共筑面向东盟AI合作新高地
2026人工智能+广电视听创新应用大赛启幕 共筑面向东盟AI合作新高地

0评论2026-06-231823

十年软件工程路,AI浪潮下职业支柱摇摇欲坠,未来路在何方?
十年软件工程路,AI浪潮下职业支柱摇摇欲坠,未来路在何方?

0评论2026-06-232731

首次占比超五成!耳夹式耳机缘何崛起?听听用户真实心声
首次占比超五成!耳夹式耳机缘何崛起?听听用户真实心声

0评论2026-06-232491

第四届链博会启幕:规模升级企业云集 新赛道成果集中亮相
第四届链博会启幕:规模升级企业云集 新赛道成果集中亮相

0评论2026-06-231207

智能经济成地方“十五五”新赛道 协同发展下机遇与挑战并存
智能经济成地方“十五五”新赛道 协同发展下机遇与挑战并存

0评论2026-06-232462

闪迪探索NAND与计算单元3D堆叠新方案 或为HBM供应难题提供破局之道
闪迪探索NAND与计算单元3D堆叠新方案 或为HBM供应难题提供破局之道

0评论2026-06-231618

八年深耕工业场景,半年连获三轮融资:物理AI大脑迎来爆发期
八年深耕工业场景,半年连获三轮融资:物理AI大脑迎来爆发期

0评论2026-06-232761

逆矩阵获超亿美元融资,创始人陈博远:通用世界模型将迎关键阶跃
逆矩阵获超亿美元融资,创始人陈博远:通用世界模型将迎关键阶跃

0评论2026-06-182512