分享好友 资讯首页 频道列表

深度求索DeepSeek V3.2基础版已现身Hugging Face,国庆前或迎正式发布

2025-09-30 08:3417320

近日,人工智能领域传来新动向,深度求索公司即将推出一款备受瞩目的全新大模型——DeepSeek V3.2。这款模型计划在国庆假期前完成正式发布,其基础版本(V3.2-Base)已悄然上传至Hugging Face平台,但目前处于隐藏状态,普通用户暂时无法直接访问。

据技术文档披露,DeepSeek V3.2的参数规模高达6850亿,采用BF16-F8_E4M3-F32张量类型进行计算,并以Safetensors格式存储模型权重。这种配置在同类模型中属于较高水平,显示出开发团队在算力优化和存储效率上的技术追求。不过,截至目前,官方尚未发布完整的模型卡片,也未部署可供调用的推理服务,开发者社区暂时无法进行实际测试。

与该系列此前模型的发布策略不同,此次DeepSeek V3.2选择在技术文档准备尚未完全就绪时提前上传基础版本,这种“先存后释”的节奏引发了AI社区的广泛讨论。部分开发者认为这可能是为后续快速迭代预留空间,也有观点指出这或许与当前大模型领域的竞争态势有关。尽管具体发布细节仍待官方确认,但可以预见的是,这款参数规模庞大的新模型将为行业带来新的技术参考。

反对 0
举报 0
收藏 0
打赏 0
评论 0
AI浪潮下企业何去何从?华为“ACT三步走”助力行业驶向智能新彼岸
AI浪潮下企业何去何从?华为“ACT三步走”助力行业驶向智能新彼岸

0评论2025-09-30618

华为盘古718B模型如何突围?从数据质量到Agent能力的系统化创新
华为盘古718B模型如何突围?从数据质量到Agent能力的系统化创新

0评论2025-09-302828

AI赋能教育新突破:从作业批改到个性化辅导,高阶AI老师正重塑学习生态
AI赋能教育新突破:从作业批改到个性化辅导,高阶AI老师正重塑学习生态

0评论2025-09-301611

DeepSeek-V3.2与智谱GLM-4.6大模型发布在即,科技圈迎新动态
DeepSeek-V3.2与智谱GLM-4.6大模型发布在即,科技圈迎新动态

0评论2025-09-302673

GPT-5助力量子计算研究,大牛Scott盛赞:半小时内给出关键证明思路
GPT-5助力量子计算研究,大牛Scott盛赞:半小时内给出关键证明思路

0评论2025-09-302247

京东2025科技大会官宣:京犀App携AI入场 打造购物生活全场景智能新体验
京东2025科技大会官宣:京犀App携AI入场 打造购物生活全场景智能新体验

0评论2025-09-262096

深度对话高通:旗舰三芯AI升级,探寻端侧AI如何破局用户需求与技术迭代
深度对话高通:旗舰三芯AI升级,探寻端侧AI如何破局用户需求与技术迭代

0评论2025-09-26592

2025云栖大会女性论坛聚焦AI浪潮 探讨女性创业优势与心理健康需求
2025云栖大会女性论坛聚焦AI浪潮 探讨女性创业优势与心理健康需求

0评论2025-09-261063

阿里吴泳铭云栖大会演讲:AGI非终点,AI三阶段演进迈向超越人类的ASI时代
阿里吴泳铭云栖大会演讲:AGI非终点,AI三阶段演进迈向超越人类的ASI时代

0评论2025-09-261438

2026相聚厦门!共赴国际机器人展,见证技术迭代与产业新机
2026相聚厦门!共赴国际机器人展,见证技术迭代与产业新机

0评论2025-09-262248