分享好友 资讯首页 频道列表

国产万亿参数大模型再次爆发 但还不是DeepSeek V4

2026-03-12 22:4220480

3月12日消息,作为国产大模型中最受期待的明星,DeepSeek V4最近一直被传发布,但都落空了,现在又有新的大模型引发热议。

这次又是在OpenRuter平台出现的,而且是两个型号,一个代号Hunter Alpha,1万亿参数量,而且支持1M上下文,多模态输出。

另一个代号Healer Alpha,262K上下文,也是多模态,但没有公布参数量,输出速度更快。

很多人猜测Hunter Alpha就是即将发布的DeepSeek V4,但AI大模型评测大佬@karminski-牙医表示它不是V4,还是智谱的新模型,可能是智谱新一代旗舰大模型。

如果了解过DeepSeek的风格,大家也应该认为不是V4,DeepSeek发布新品之前没有在Openruter这样测试过,而是习惯低调上线,之后在群里发布一则简短的消息确认有新品。

DeepSeek V4这几天也有很多网传的新正经,比如1万亿参数量,MOE激活320亿参数,1M上下文,原生多模态,并且为昇腾910C平台优化,而不是只为NVIDIA或者AMD等国外芯片优化。

不过这些爆料可信度一般,目前比较可信一点的反而是下面这一条:知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek-V4-INT8权重,暗示了V4支持INT8算法,更关键的是这意味着V4这次真的差不多要发布了。

还有爆料说DeepSeek要求供应商在6-20号期间保持稳定,最近两天还在做最后的压力测试,很快就能发了。

反正耐心等等吧,好饭不怕晚。

反对 0
举报 0
收藏 0
打赏 0
评论 0
GPT-5.5为何爱说哥布林?OpenAI笑着说出真相
GPT-5.5为何爱说哥布林?OpenAI笑着说出真相

0评论2026-05-01939

特努斯掌舵前布局AI,重组苹果硬件部门或开启高效开发新篇章
特努斯掌舵前布局AI,重组苹果硬件部门或开启高效开发新篇章

0评论2026-04-23774

荣耀跨界出奇招:手机制造商勇夺机器人半马冠军 彰显AI生态新实力
荣耀跨界出奇招:手机制造商勇夺机器人半马冠军 彰显AI生态新实力

0评论2026-04-232287

首次全年扭亏为盈后,寒武纪正面回应大厂竞争:通用芯片具备更强“技术普适性”
首次全年扭亏为盈后,寒武纪正面回应大厂竞争:通用芯片具备更强“技术普适性”

0评论2026-04-231876

2026年AI数据采集新趋势:网络数据基础架构崛起成关键支撑
2026年AI数据采集新趋势:网络数据基础架构崛起成关键支撑

0评论2026-04-16759

与AI对话或成呈堂证供,美国律师提醒谨慎使用AI
与AI对话或成呈堂证供,美国律师提醒谨慎使用AI

0评论2026-04-161997

华为携手伙伴赋能交通运输:AI深度融合,共筑数智化升级新未来
华为携手伙伴赋能交通运输:AI深度融合,共筑数智化升级新未来

0评论2026-04-162137

AI玩具赛道加速进化:智能体突破“套壳”困局,千亿市场开启新想象
AI玩具赛道加速进化:智能体突破“套壳”困局,千亿市场开启新想象

0评论2026-04-131744

Linux内核新规:AI生成代码获准使用,提交者担责成关键
Linux内核新规:AI生成代码获准使用,提交者担责成关键

0评论2026-04-132589

CVPR 2026 WorldArena挑战赛启幕 高德开源ABot-PhysWorld助力世界模型实用化转型
CVPR 2026 WorldArena挑战赛启幕 高德开源ABot-PhysWorld助力世界模型实用化转型

0评论2026-04-131365