分享好友 资讯首页 频道列表

国产大模型新动态:OpenRuter现双雄,DeepSeek V4发布在即引期待

2026-03-12 22:4223760

近期,国产大模型领域动态不断,此前备受瞩目的DeepSeek V4虽多次传出发布消息却均未成真,而如今又有两款新大模型在OpenRuter平台引发广泛关注与热议。

此次出现在OpenRuter平台的是两个不同型号的大模型。其中一个代号为Hunter Alpha,拥有高达1万亿的参数量,支持1M上下文,并且具备多模态输出能力;另一个代号Healer Alpha,其上下文为262k,同样支持多模态,不过参数量未对外公布,但输出速度相对更快。

对于Hunter Alpha,不少人猜测它就是即将发布的DeepSeek V4。然而,AI大模型评测领域的知名人士@karminski - 牙医却表示,Hunter Alpha并非DeepSeek V4,而是智谱的新模型,极有可能是智谱新一代的旗舰大模型。从DeepSeek过往发布新品的风格来看,这种猜测似乎也有一定道理。DeepSeek在发布新品前,通常不会在Openruter这样的平台进行测试,而是习惯低调上线,之后仅在群里发布一条简短消息来确认新品发布。

尽管DeepSeek V4尚未正式发布,但网络上关于它的各种传闻却层出不穷。有传闻称,DeepSeek V4拥有1万亿参数量,MOE激活320亿参数,支持1M上下文,具备原生多模态能力,并且针对昇腾910C平台进行了优化,并非仅局限于为NVIDIA或者AMD等国外芯片优化。不过,这些爆料的可信度有待考量。

相比之下,有一条爆料显得更具可信度。知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek - V4 - INT8权重,这一举动暗示了DeepSeek V4支持INT8算法,更重要的是,这似乎意味着DeepSeek V4的发布已经进入倒计时。

还有消息透露,DeepSeek要求供应商在6 - 20号期间保持稳定,并且最近两天还在进行最后的压力测试。种种迹象表明,DeepSeek V4或许很快就会与大家见面,大家不妨耐心等待。

反对 0
举报 0
收藏 0
打赏 0
评论 0
AI成科研新引擎:从数学难题到黑洞方程 科学发现驶入加速新赛道
AI成科研新引擎:从数学难题到黑洞方程 科学发现驶入加速新赛道

0评论2026-03-201647

三星电子社长卢泰文会见AMD CEO苏姿丰或扩大合作范围
三星电子社长卢泰文会见AMD CEO苏姿丰或扩大合作范围

0评论2026-03-202979

蚂蚁灵波携手乐聚机器人,共探具身智能新路径加速“一脑多机”落地
蚂蚁灵波携手乐聚机器人,共探具身智能新路径加速“一脑多机”落地

0评论2026-03-172446

台大与IBM联合研究:LoRA微调“新招”未必强,调优学习率是关键
台大与IBM联合研究:LoRA微调“新招”未必强,调优学习率是关键

0评论2026-03-17669

追觅跨界入局手机市场:联姻努比亚推AI旗舰,百亿布局剑指高端领域
追觅跨界入局手机市场:联姻努比亚推AI旗舰,百亿布局剑指高端领域

0评论2026-03-13791

基准测试不等于真实能力?研究称AI代码“通过率”或被高估最高达7倍
基准测试不等于真实能力?研究称AI代码“通过率”或被高估最高达7倍

0评论2026-03-121657

OpenAI调整ChatGPT电商战略:聚焦零售商应用,弱化直接结账模式
OpenAI调整ChatGPT电商战略:聚焦零售商应用,弱化直接结账模式

0评论2026-03-122165

天数智芯AWE展云边端全栈算力,以硬核创新助力智慧生活与产业升级
天数智芯AWE展云边端全栈算力,以硬核创新助力智慧生活与产业升级

0评论2026-03-121771

苹果M5 Pro与M5 Max亮相:3nm工艺加持,CPU与GPU性能迎来飞跃式提升
苹果M5 Pro与M5 Max亮相:3nm工艺加持,CPU与GPU性能迎来飞跃式提升

0评论2026-03-052775

荣耀MWC发布机器人手机与人形机器人,以AHI理念引领AI终端新变革
荣耀MWC发布机器人手机与人形机器人,以AHI理念引领AI终端新变革

0评论2026-03-051149