分享好友 资讯首页 频道列表

商汤大装置SenseCore携手华为昇腾384超节点,共筑AI算力新生态

2025-09-07 02:226410

商汤科技与华为近日宣布,其联合研发的商汤大装置SenseCore已与华为昇腾384超节点完成深度适配,在功能与性能验证中达到预期目标。此次合作标志着国产AI算力基础设施在跨平台协同与效率优化方面取得重要突破。

昇腾384超节点(Atlas 900 A3 SuperPoD)是华为推出的全球最大规模超节点方案,其核心创新在于“全对等架构”。该架构突破传统服务器总线限制,将高速互联总线扩展至整机柜及跨机柜层级,实现CPU、NPU、DPU、存储及内存资源的全域互联与池化,构建出单台“超级计算机”。这种设计显著提升了算力密度与互联带宽,为AI大模型训练提供了更高效的底层支持。

商汤大装置SenseCore针对超节点特性进行了多项技术优化。在调度层面,平台不仅支持单机、多机及跨超节点(POD)的灵活调度,还通过模型并行策略实现逻辑超节点的自动划分。这一创新使EP/TP等大通信策略能够充分利用灵衢网络,大幅缩短模型训练周期。例如,在跨POD训练场景中,SenseCore团队通过修复多POD环境下master/work任务rank乱序问题,从根本上解决了训练任务概率性失败的技术瓶颈。

在系统可靠性方面,SenseCore构建了多维度故障检测与恢复体系。该体系覆盖服务器硬件、高速互联总线、RoCE网络及任务进程等软硬件层级,结合Job/Pod/进程三级恢复机制,显著提升了昇腾384超节点在长周期训练任务中的稳定性。据技术文档显示,这一优化使超节点在复杂训练场景下的容错能力提升超过40%。

双方技术团队透露,下一步将重点拓展三大应用方向:一是开发大模型推理加速方案,降低AI应用部署成本;二是构建智能体应用部署框架,支持复杂AI系统的快速落地;三是针对医疗、金融等垂直行业,优化大模型训练与推理的专用算法。这些探索有望推动国产AI算力平台在更多产业领域的规模化应用。

反对 0
举报 0
收藏 0
打赏 0
评论 0
AI云时代激战正酣:阿里云深耕基础,火山引擎MaaS赛道突围
AI云时代激战正酣:阿里云深耕基础,火山引擎MaaS赛道突围

0评论2025-10-29866

360发布企业级智能体平台,覆盖全阶段能力,助力政企迈入智能体时代
360发布企业级智能体平台,覆盖全阶段能力,助力政企迈入智能体时代

0评论2025-10-29641

2025世界农业科技创新大会启幕,神农AI大模型3.0等成果共促全球粮食安全
2025世界农业科技创新大会启幕,神农AI大模型3.0等成果共促全球粮食安全

0评论2025-10-15867

OpenAI与Arm携手共进:合作研发AI芯片架构,布局AI基础设施新蓝图
OpenAI与Arm携手共进:合作研发AI芯片架构,布局AI基础设施新蓝图

0评论2025-10-15810

马斯克xAI入局“世界模型”竞赛,视觉模型能否开启AI新篇章?
马斯克xAI入局“世界模型”竞赛,视觉模型能否开启AI新篇章?

0评论2025-10-132533

中国移动升级"AI+"行动计划 2028年建成国内最大智算设施
中国移动升级"AI+"行动计划 2028年建成国内最大智算设施

0评论2025-10-132739

英伟达股价创新高至193美元,获出口许可,券商上调目标价至300美元
英伟达股价创新高至193美元,获出口许可,券商上调目标价至300美元

0评论2025-10-111525

AI大模型:学习能力惊人引担忧,人类该如何筑牢安全防火墙?
AI大模型:学习能力惊人引担忧,人类该如何筑牢安全防火墙?

0评论2025-10-112485

广发证券:CXL技术赋能AI计算 存储池化与高速互连推动行业新发展
广发证券:CXL技术赋能AI计算 存储池化与高速互连推动行业新发展

0评论2025-10-111633

《时代》2025最佳发明榜单揭晓 宇树Unitree R1双足机器人凭实力登榜
《时代》2025最佳发明榜单揭晓 宇树Unitree R1双足机器人凭实力登榜

0评论2025-10-111173