国庆前夕DeepSeek-V3.2现身HuggingFace后又404 后续动态引关注
国庆前夕DeepSeek-V3.2现身HuggingFace后又404 后续动态引关注
0评论2025-09-301791
Flash Attention作者播客谈AI未来:英伟达GPU主导或三年内生变,推理成本有望再降10倍
Flash Attention作者播客谈AI未来:英伟达GPU主导或三年内生变,推理成本有望再降10倍
0评论2025-09-302567
DeepSeek-V3.2-Exp模型上线:引入稀疏注意力机制,API调用成本直降超五成
DeepSeek-V3.2-Exp模型上线:引入稀疏注意力机制,API调用成本直降超五成
0评论2025-09-302511
Anthropic发布Claude Sonnet 4.5:编码性能跃升,安全与自主性全面升级
Anthropic发布Claude Sonnet 4.5:编码性能跃升,安全与自主性全面升级
0评论2025-09-303097
DeepSeek V3.2模型现身HuggingFace页面 智谱GLM4.6也将携更大上下文登场
DeepSeek V3.2模型现身HuggingFace页面 智谱GLM4.6也将携更大上下文登场
0评论2025-09-301068
DeepSeek-V3.2-Exp模型开源发布,华为云MaaS平台部署采用长序列亲和并行策略
DeepSeek-V3.2-Exp模型开源发布,华为云MaaS平台部署采用长序列亲和并行策略
0评论2025-09-30721
华为云率先适配DeepSeek-V3.2-Exp模型,ModelArts平台提供高效推理服务
华为云率先适配DeepSeek-V3.2-Exp模型,ModelArts平台提供高效推理服务
0评论2025-09-302339
Anthropic发布Claude Sonnet 4.5:代码与智能体构建能力飙升,构建工具同步开放
Anthropic发布Claude Sonnet 4.5:代码与智能体构建能力飙升,构建工具同步开放
0评论2025-09-30974