分享好友 资讯首页 频道列表

类脑智算集群实现大模型快速推理,杭州灵汐引领商用试运行新篇章

2025-08-17 20:5718430

杭州灵汐类脑科技有限公司携手中国电信、中国电子科技南湖研究院及脑启社区,于七月底成功启动了“杭州灵汐类脑智算集群”的企业服务试运行,标志着大模型快速推理API正式步入商业化测试阶段。该集群由杭州电信负责集成建设,落户于中国电信杭州智算中心,算力规模突破200POPS大关,成为全球首个以支持大模型快速推理方式投入商用的类脑智算集群。

作为类脑智能技术的创新实践,“杭州灵汐类脑智算集群”凭借其独特的“存算一体、众核并行、稀疏计算、事件驱动”特性,在计算效率与能耗控制上实现了质的飞跃。这一技术革新不仅大幅提升了大语言模型的推理速度,将单用户推理延迟缩短至毫秒级,相较于传统方案,其速度性能优势显著,能够流畅应对实时交互与深度推理需求,彻底告别卡顿现象。同时,首token延迟也显著降低,达到百毫秒乃至十毫秒级别。该智算集群的功耗较业界同等推理算力水平降低了二分之一至三分之二以上,展现了极高的能效比。

图:灵汐智算平台大模型登录界面

异构融合类脑芯片是该集群的另一大亮点,其内置的类CUDA软件栈兼容PyTorch框架,使得多类开源大模型无需转换类脑算法即可直接享受快速推理服务。这一特性极大地拓宽了类脑智算集群的应用范围,为行业提供了更为便捷、高效的解决方案。

图:灵汐智算平台大模型快速推理界面

当前,大模型推理领域普遍面临吞吐速度慢、高延迟等挑战,这对众多行业应用场景构成了严重制约。针对这一问题,灵汐科技凭借类脑智能技术,推出了“高实时、高吞吐、低延迟”的推理服务解决方案。该方案在金融应用、情感陪聊、快速导览、大规模数据标注以及无人机实时航拍处理、灾害预警与应急处置等多个领域展现出巨大潜力,有望推动这些行业向更高效、更智能的方向发展。

反对 0
举报 0
收藏 0
打赏 0
评论 0
阿里被曝秘密启动“千问”项目 欲打造个人AI助手对标ChatGPT 公司未确认
阿里被曝秘密启动“千问”项目 欲打造个人AI助手对标ChatGPT 公司未确认

0评论2025-11-132702

OpenAI推出GPT-5.1:沟通更自然,情绪价值拉满,付费用户先享
OpenAI推出GPT-5.1:沟通更自然,情绪价值拉满,付费用户先享

0评论2025-11-131212

手机AI新赛道:苹果领航隐私性能双兼顾,华为谷歌等紧随其后
手机AI新赛道:苹果领航隐私性能双兼顾,华为谷歌等紧随其后

0评论2025-11-132549

天玑9500以超前配置破“性能过剩”迷思,为未来使用体验兜底
天玑9500以超前配置破“性能过剩”迷思,为未来使用体验兜底

0评论2025-11-132147

叮咚买菜2025年Q3业绩出炉:营收利润双增,梁昌霖谈未来聚焦效率与能力
叮咚买菜2025年Q3业绩出炉:营收利润双增,梁昌霖谈未来聚焦效率与能力

0评论2025-11-131465

清华大学研发DeepPrune技术:为AI推理“瘦身” 开启高效思考新路径
清华大学研发DeepPrune技术:为AI推理“瘦身” 开启高效思考新路径

0评论2025-11-131229

罗福莉官宣加盟小米MiMo团队!40人合影或暗示小米AGI新方向
罗福莉官宣加盟小米MiMo团队!40人合影或暗示小米AGI新方向

0评论2025-11-132150

特斯拉与沃尔沃大模型获批上线,外企AI服务助力汽车行业智能化升级
特斯拉与沃尔沃大模型获批上线,外企AI服务助力汽车行业智能化升级

0评论2025-11-132179

上海助力外企大模型发展 特斯拉、沃尔沃两款产品成全国首批获批上线者
上海助力外企大模型发展 特斯拉、沃尔沃两款产品成全国首批获批上线者

0评论2025-11-13906