分享好友 资讯首页 频道列表

海光DCU率先完成GLM-5.2 Day-0适配 长程任务国产底座就绪

2026-06-18 00:1626040

6月17日消息,近日,新一代旗舰开源大模型GLM-5.2发布,海光DCU产品已实现Day 0极速适配。国内开发者无需经历漫长的等待与代码重构,即可在搭载海光DCU的国产算力平台上体验其完整性能与满血实力。

GLM-5.2是智谱面向Coding与长程任务打造的旗舰开源模型,代码能力位居开源模型之首。在全球百万开发者参与的Code Arena前端盲测中,GLM-5.2位列全球可用模型第一。在Terminal-Bench 2.1(AI Agent命令行操作评测)中,GLM-5.2比Claude Opus 4.8低4%,较前代GLM-5.1提升17.5%;在MCP-Atlas(工具使用评测)上距Opus 4.8仅0.8%差距。综合Coding实力大致位于Opus 4.7至4.8区间,主流编程基准保持开源SOTA。

本次适配的核心亮点在于对Solid1M(100万)无损上下文的完美支持。过去,受限于算力带宽与显存管理效率,长上下文往往在实际应用中出现性能劣化。而海光DCU凭借其高带宽内存访问能力和针对长序列推理的优化指令集,成功支撑了GLM-5.2模型在1M上下文窗口下的稳定表现,为“长程任务”提供了坚实的物理基础,这种能力让AI从“辅助对话”进化为“自主执行”,极大地释放了开发者的生产力。

海光DCU针对GLM-5.2的双核心场景进行了深度优化。长上下文推理方面,通过内存调度机制优化与IndexShare技术(在每四层稀疏注意力层之间复用索引器),1M上下文下单位Token的FLOPs消耗显著降低,确保超大规模序列处理的稳定性与效率。代码生成方面,对关键算子专项调优,保障复杂系统工程中的推理性能。

在实际长程任务中,海光DCU为GLM-5.2提供了持续稳定的算力底座。模型可在平台上连续完成覆盖Web、移动端与小程序的多端应用开发,累计处理88万以上的tokens。凭借IndexShare架构与海光DCU硬件特性的深度契合,双方共同实现了在有限算力资源下处理超大规模任务的可能。这不仅意味着国内开发者无需等待即可在国产平台上体验到媲美国际顶尖水平的模型性能,更意味着核心数据与关键业务逻辑可以在完全自主可控的算力底座上安全运行。

海光信息与智谱正持续推进GLM-5.2的深层优化,进一步释放硬件潜力。双方后续将围绕长程任务与代码能力展开更多场景化验证,推动模型在真实软件开发与系统优化中的规模化落地。

反对 0
举报 0
收藏 0
打赏 0
评论 0
光热储能研究生科研指南:巨星教授揭秘破局同质化与创新之道
光热储能研究生科研指南:巨星教授揭秘破局同质化与创新之道

0评论2026-06-182265

九识(苏州)智能科技注册资本增至2.13亿 聚焦人工智能领域发展
九识(苏州)智能科技注册资本增至2.13亿 聚焦人工智能领域发展

0评论2026-06-182195

捷象灵越获极智嘉战略投资 共拓全球托盘自动化市场
捷象灵越获极智嘉战略投资 共拓全球托盘自动化市场

0评论2026-06-182303

智能眼镜成首批受益者!高通推出全新个人 AI 设备上市加速计划
智能眼镜成首批受益者!高通推出全新个人 AI 设备上市加速计划

0评论2026-06-18759

九章云极AI工厂战略发布:以DCU为尺 引领智算产业迈向“价值消费”新时代
九章云极AI工厂战略发布:以DCU为尺 引领智算产业迈向“价值消费”新时代

0评论2026-06-182069

伏塔(北京)人工智能科技公司成立 卫蓝新能源等携手布局AI领域
伏塔(北京)人工智能科技公司成立 卫蓝新能源等携手布局AI领域

0评论2026-06-111250

华纳音乐集团收购Sureel AI,助力版权持有者在AI领域获署名与报酬
华纳音乐集团收购Sureel AI,助力版权持有者在AI领域获署名与报酬

0评论2026-06-11958

三星2026台北电脑展秀肌肉:HBM5样模登场 HPB散热技术成亮点
三星2026台北电脑展秀肌肉:HBM5样模登场 HPB散热技术成亮点

0评论2026-06-042952