分享好友 资讯首页 频道列表

DeepSeek与寒武纪同步发力:新模型发布与适配优化共启AI新篇

2025-09-30 08:3321350

国内人工智能领域两大领军企业DeepSeek与寒武纪近日同步推进重要技术进展,引发行业高度关注。9月29日傍晚,DeepSeek通过官方渠道率先发布新一代实验性模型DeepSeek-V3.2-Exp,该版本在原有V3.1-Terminus架构基础上引入创新的稀疏注意力机制,重点优化长文本场景下的训练与推理效率。

据技术团队介绍,此次升级的DeepSeek Sparse Attention技术通过动态调整计算资源分配,有效降低了长序列处理过程中的算力消耗。为加速生态建设,DeepSeek同步下调API调用价格超50%,并完成官方应用、网页端及小程序的全平台更新。开发者现可通过原有接口直接调用新模型,享受更高效的算力支持与更低的开发成本。

紧随其后,寒武纪于18时11分通过开发者平台宣布完成技术适配。其自主研发的vLLM-MLU推理引擎源代码已实现开源,开发者可在寒武纪软硬件一体化平台上直接部署DeepSeek-V3.2-Exp模型。技术文档显示,此次适配通过Triton算子开发与BangC融合算子技术,使新模型在寒武纪芯片上的计算效率达到行业领先水平。

寒武纪研发团队透露,针对稀疏注意力机制特性,公司采用计算通信并行策略进行深度优化。这种软硬件协同创新模式,使得长序列场景下的训练推理成本显著降低。此前双方在DeepSeek系列模型上的合作已验证了这种技术路径的可行性,此次实验性版本的快速适配进一步巩固了技术优势。

行业分析师指出,两家企业从模型发布到生态适配的紧密协作,展现了中国AI产业链在关键技术环节的协同能力。这种同步推进的技术演进模式,不仅缩短了新技术的产业化周期,更为下游应用提供了更具性价比的解决方案。特别是在需要处理超长文本的金融、法律、科研等领域,相关技术突破将带来显著效率提升。

技术文档显示,寒武纪此次开源的推理引擎包含完整的模型部署指南与性能测试工具。开发者可通过指定代码仓库获取相关资源,按照文档指引即可在寒武纪MLU系列芯片上实现模型部署。这种开放的技术生态建设,有望吸引更多开发者参与AI应用创新。

市场观察人士认为,此次技术联动标志着中国AI产业从单点突破转向系统化创新。通过模型架构创新与硬件加速技术的深度融合,国内企业正在构建具有自主知识产权的技术体系。这种发展模式或将改变全球AI技术竞争格局,为产业升级提供新的技术路径。

反对 0
举报 0
收藏 0
打赏 0
评论 0
智能机器人租赁选型指南:技术适配+场景覆盖+服务响应,重庆汇景宣实力解析
智能机器人租赁选型指南:技术适配+场景覆盖+服务响应,重庆汇景宣实力解析

0评论2026-06-011594

西南石油大学南充校区团队匠心打造!智能陪护机器人“小黄”温暖登场
西南石油大学南充校区团队匠心打造!智能陪护机器人“小黄”温暖登场

0评论2026-06-011499

触拓CT185H1会议预约屏:告别传统管理,让会议室预约更智能高效
触拓CT185H1会议预约屏:告别传统管理,让会议室预约更智能高效

0评论2026-06-012921

荣耀600与OPPO Reno16谁更值?全场景拍摄能力成性价比关键考量
荣耀600与OPPO Reno16谁更值?全场景拍摄能力成性价比关键考量

0评论2026-06-012523

神舟二十三号即将发射 航天员朱杨柱再征太空 家乡亲友翘首以盼
神舟二十三号即将发射 航天员朱杨柱再征太空 家乡亲友翘首以盼

0评论2026-06-01764

鸿擎科技助力!我国成功发射卫星互联网技术试验卫星开展多项验证
鸿擎科技助力!我国成功发射卫星互联网技术试验卫星开展多项验证

0评论2026-06-012116

民爆光电跨界并购厦芝精密:照明龙头借AI东风,市值飙升超200亿
民爆光电跨界并购厦芝精密:照明龙头借AI东风,市值飙升超200亿

0评论2026-06-01635

北交所新股动态:彩客科技申购,长进光子、龙辰科技今日携手上市
北交所新股动态:彩客科技申购,长进光子、龙辰科技今日携手上市

0评论2026-06-012047

苹果今秋更新家庭产品线:Apple TV性能升级,HomePod mini搭载新版Siri迎智能新体验
苹果今秋更新家庭产品线:Apple TV性能升级,HomePod mini搭载新版Siri迎智能新体验

0评论2026-06-012914