分享好友 资讯首页 频道列表

DeepSeek策略揭秘:压缩推理成本,全力投入AGI内部研发

2025-07-08 00:1120170

在AI大模型市场的风起云涌中,DeepSeek R1的横空出世无疑成为了一颗震撼弹,仅仅128天的时间,便深刻改变了行业的格局。

DeepSeek R1的问世,如同一把利剑,直接刺破了推理模型价格的高墙。OpenAI在六月更新的o3价格,相较于之前的o1,价格直接打了二折,这无疑为整个市场树立了新的价格标杆。

与此同时,第三方平台上DeepSeek模型的使用量呈现爆炸式增长,与刚发布时相比,增长了近20倍,这一趋势不仅推动了AI技术的普及,更为众多云计算厂商带来了前所未有的商业机遇。

然而,令人意外的是,尽管DeepSeek模型在第三方平台上大放异彩,但其自家的网站和API市场份额却出现了下滑,似乎未能跟上AI产品上半年持续增长的步伐。

据SemiAnalysis发布的一篇深度报告揭示,DeepSeek之所以能够迅速降低推理模型的价格,背后是其对服务质量的妥协。用户在使用DeepSeek官方平台时,往往需要等待数秒才能看到第一个字符的出现,这一首token延迟的问题,成为了制约其用户体验的关键因素。

相比之下,虽然其他平台的价格普遍更高,但其在响应速度上的优势却显而易见。例如,在Parasail或Friendli等平台,用户只需支付3-4美元,便可享受到几乎零延迟的100万token服务。而微软Azure平台,尽管价格是DeepSeek官方的2.5倍,但其延迟却减少了整整25秒。

DeepSeek在价格与性能之间的权衡也显而易见。在有限的推理计算资源下,DeepSeek只提供了64k的上下文窗口服务,这在主流模型提供商中堪称最小之一。对于需要读取整个代码库的编程场景而言,64k的上下文窗口显然不够用,因此用户更倾向于选择第三方平台。

值得注意的是,DeepSeek的这些降本策略并非偶然,而是其主动做出的决定。DeepSeek目前似乎并不太关注用户体验,也无意通过聊天应用或API服务向用户提供大量token,而是将更多的算力资源投入到内部研发中,以实现其AGI的宏伟目标。

DeepSeek的这一策略,不仅降低了推理服务的成本,还通过开源策略吸引了其他云服务托管其模型,从而赢得了更广泛的影响力并培养了生态。然而,这也使得DeepSeek在用户体验上有所欠缺,尤其是在响应速度和上下文窗口大小等方面。

在DeepSeek的影响下,其他大模型供应商也开始调整策略。例如,Claude为了缓解算力紧张的问题,降低了输出速度,但仍然在努力平衡用户体验。而Claude模型的设计也更加注重生成简洁的回复,以减少token的使用量。

这些迹象表明,大模型供应商正在从多个维度改进模型,不仅追求模型的智能上限,更注重提升每个token所能提供的智能。这一趋势无疑将推动AI技术的进一步发展,为用户带来更加高效、智能的服务。

反对 0
举报 0
收藏 0
打赏 0
评论 0
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈

0评论2026-05-01780

中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战
中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战

0评论2026-05-012881

农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代
农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代

0评论2026-05-01708

贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级
贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级

0评论2026-05-012299

乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?
乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?

0评论2026-05-012367

OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端
OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端

0评论2026-04-232882

消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场
消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场

0评论2026-04-232718

阿维塔06T全场景运动轿车上市:21.99万元起
阿维塔06T全场景运动轿车上市:21.99万元起

0评论2026-04-232679

Claude Pro 订阅方案调整:部分新用户或失去 Claude Code 使用权
Claude Pro 订阅方案调整:部分新用户或失去 Claude Code 使用权

0评论2026-04-231389