分享好友 资讯首页 频道列表

华为云率先适配DeepSeek-V3.2-Exp模型,ModelArts平台提供高效推理服务

2025-09-30 08:3321280

华为云宣布,其CloudMatrix384超节点架构已全面支持最新开源的DeepSeek-V3.2-Exp大模型,并完成全平台适配工作。该模型凭借创新的稀疏Attention机制,在降低计算资源消耗的同时显著提升了推理效率,支持最长160K字符的上下文处理能力,成为当前长序列处理领域的标杆性技术突破。

作为首个完成适配的云服务商,华为云通过ModelArts推理平台为DeepSeek-V3.2-Exp提供企业级部署方案。平台采用动态资源分配技术,可根据实时负载自动调整算力供给,实现计算资源的分时复用与弹性扩缩容。针对模型特有的稀疏Attention结构,技术团队开发了长序列亲和的上下文并行策略,在保证低时延的前提下优化了吞吐性能。

在部署架构方面,华为云延续了大EP并行方案,通过多维度并行计算技术将模型参数分散至不同计算节点。这种设计不仅充分发挥了CloudMatrix384超节点的集群优势,更通过优化数据流传输路径,使长序列推理的内存占用降低37%,整体推理速度提升2.1倍。

目前,DeepSeek-V3.2-Exp已正式登陆华为云大模型即服务平台(MaaS),向企业客户和开发者开放全功能体验。用户可通过华为云控制台进入模型服务专区,选择"DeepSeek-V3.2-Exp"即可进行在线交互测试,或通过API接口调用模型能力。平台提供的可视化调试工具支持参数动态调整,帮助开发者快速完成模型微调。

技术文档显示,该模型在金融、法律、科研等长文本处理场景中表现优异。在某金融机构的合同审核测试中,模型对200页以上复杂文档的关键条款提取准确率达98.7%,处理时间较传统方法缩短82%。华为云工程师透露,后续将推出针对特定行业的预训练版本,进一步降低企业应用门槛。

开发者可通过华为云官网(https://console.huaweicloud.com/modelarts/maas-mobile/#/chat )直接体验模型能力。平台提供免费的基础配额服务,支持按需升级至专业版。技术社区反馈显示,早期测试用户对模型的长序列记忆能力和逻辑连贯性给予高度评价,特别是在多轮对话和复杂推理场景中表现突出。

反对 0
举报 0
收藏 0
打赏 0
评论 0
青春筑梦智慧城:以专业之力绘就高效便捷现代生活新画卷
青春筑梦智慧城:以专业之力绘就高效便捷现代生活新画卷

0评论2025-09-302878

张宏院士深圳讲堂:以AI赋能机器人 开启开放世界“生活”新篇
张宏院士深圳讲堂:以AI赋能机器人 开启开放世界“生活”新篇

0评论2025-09-30509

南宁“多快好省”发力 搭建中国—东盟AI产业合作新桥梁
南宁“多快好省”发力 搭建中国—东盟AI产业合作新桥梁

0评论2025-09-301975

可灵AI 2.5 Turbo性能跃升成本锐降,高盛:快手领跑全球AI视频生成赛道
可灵AI 2.5 Turbo性能跃升成本锐降,高盛:快手领跑全球AI视频生成赛道

0评论2025-09-27993

华为“ACT”三步走:以方法论、硬实力与生态助力行业智能化破局
华为“ACT”三步走:以方法论、硬实力与生态助力行业智能化破局

0评论2025-09-262513

京东股价午间涨幅超6% CEO许冉布局AI未来三年带动万亿生态
京东股价午间涨幅超6% CEO许冉布局AI未来三年带动万亿生态

0评论2025-09-262065

谷歌2026年将推Android与ChromeOS融合生态,笔记本或成新生态重点
谷歌2026年将推Android与ChromeOS融合生态,笔记本或成新生态重点

0评论2025-09-262610

京东JDD大会发布AI全景图 许冉:以模型×体验×产业厚度平方驱动AI价值
京东JDD大会发布AI全景图 许冉:以模型×体验×产业厚度平方驱动AI价值

0评论2025-09-261015

京东AI深度应用成果斐然,布局万亿生态引领产业智能化未来
京东AI深度应用成果斐然,布局万亿生态引领产业智能化未来

0评论2025-09-26514

Meta Vibes平台上线:开启AI视频创作新篇,免费工具助力创意灵感落地
Meta Vibes平台上线:开启AI视频创作新篇,免费工具助力创意灵感落地

0评论2025-09-261742