去创作

用微信扫描二维码

分享至好友和朋友圈

DeepSeek突然降价,行业大地震

就在近期,DeepSeek一下甩出了两颗深水炸弹。

DeepSeek-V4-Flash的输入缓存价直接干到了0.02元/百万Token,V4-Pro叠加此前的2.5折限时优惠后,最低只需0.025元/百万Token,只要2分钱!

相比首发定价,Pro版实际价格已降至原价的四十分之一。

如果你对这个价格还没有概念,我们换一种说法:同样生成百万Token的输出,OpenAI刚发布的GPT-5.5Pro要收30美元;而DeepSeek-V4-Flash只收2元不到,约0.146美元。

算下来,DeepSeek的价格大约只有GPT-5.5Pro的两百分之一。

图源:每日经济新闻

两百分之一,这是什么概念?大概等于你用一杯奶茶的钱,撬动了美国人买一台iPhone的预算。

更夸张的是,DeepSeek在官方文档中表示:受限于高端算力,目前Pro版服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro价格还会大幅下调。

图源:DeepSeek

大模型赛道的成本天花板,正在以一种令所有人措手不及的速度坍塌。

DeepSeek两天两刀,行业彻底懵了

让我们先回到这场风暴的最初源头。

4月24日,DeepSeek-V4预览版正式发布,同步开源,标配百万token超长上下文。

性能上,V4-Pro在MMLU-Pro测试中得分87.5%,发稿即支持8大主流云平台一键部署,且已在华为昇腾NPU上完成正式适配——成为首个在官方技术文档中明确认证支持国产AI芯片的万亿参数级大模型。

图源:证券时报

彼时的首发定价,对比国际大牌已经很惊人了:DeepSeek-V4-Pro的输出定价只有24元人民币/百万Token,再往下,更有仅为前者零头的V4-Flash输出定价2元人民币/百万Token。

而在市场还没来得及消化这个定价的时候,一贯被称为“价格屠夫”的DeepSeek却突然再次按下了加速键。

4月25日晚间,DeepSeek突然宣布对V4-Pro限时2.5折。紧接着第二天,全系API的输入缓存命中价,永久降至原有价格的1/10。

两次动作叠加之后,不仅仅是Pro版从首发的1元降至0.025元/百万Token那样简单。真正的胜负手,是它把缓存命中场景的成本逻辑彻底打穿了。

比如在RAG知识库构建、智能客服、长文档分析或高频率Agent调用场景中,往往只需极少数未命中缓存的新增请求,绝大部分Token都会命中缓存,既保住了长上下文的完整容量,又让开发者的成本直接下降了90%以上。

根据DeepSeek官方宣布的技术规格,V4系列模型上下文长度已从以往版本的128K扩展至1M,实现了接近十倍的容量提升。而实现极致效率的秘密武器,是新的注意力机制。

图源:DeepSeek

简而言之,V4采用了一种创新的DSA稀疏注意力架构,在Token维度做了压缩。

换一种大家都能听懂的说法:模型学会了“捡重点”——强关联的核心内容精读,弱关联的背景元素压缩或跳过。

效果立竿见影,在百万Token长文本场景下,Pro版单Token推理的计算量仅为前代V3.2的27%,KV缓存占用降到了10%。

这种办法避开了Transformer的平方复杂度硬伤,也改变了长上下文的使用成本模型。

这段时间,大量高性能闭源模型的出现,一度让部分行业的盈利棱镜陷入扭曲。

而这一次,DeepSeek以极低的成本定价,让企业级用户从“够用”彻底进入了“用得爽”的阶段。

无论如何,DeepSeek此番足以让此前依赖高定价维持估值、把稀缺性作为溢价的玩家们,真的开始坐不住了。

用脚投票的市场和无法安坐的大厂

市场的反应比任何分析师研报都来得直接。

4月27日白天,智谱和MiniMax股价开盘后持续下挫,MiniMax一度深跌逼近15%。

要知道,数月前这两家公司刚刚创造了港股科技板块的市值巅峰,MiniMax更是凭借资深的AI大模型稀缺性,登上过港股第一高价股宝座,市价一度大幅超越百度、京东等互联网老面孔。

图源:证券时报

市场情绪突然扭转,核心原因跟DeepSeek脱不了关系。

投资者突然意识到,当一家开源厂商永久下调输入缓存价至百万Token两分钱时,此前那些依赖谈判技巧和私有定价维持高利润的实现路径,似乎堵住了。

海通国际分析师张晓飞对此有一个精准的描述:“DeepSeekV4同时打破了两个魔咒。”

第一,它打破了“开源模型永远落后闭源顶流”的神话,闭源厂商再也没法光靠性能壁垒搞价格收割了;

第二,它打破了顶级大语言模型对英伟达CUDA生态的绝对依赖,全栈适配华为昇腾等国产AI芯片,AI生态正在发生根本性的迁移。

更令大厂后怕的,可能是那张DeepSeek在技术文档中首度披露的清单一它将华为昇腾NPU与英伟达GPU并列写入硬件验证清单。这个跨时代的动作被视为国产AI自主可控迈向里程碑式标志之一的信号。

对此,华为很快公布了推理性能上的关键突破。

昇腾950性能表现|图源:昇腾CANN直播截图

通过双方芯模技术的深度协同,昇腾950超节点在支持V4系列模型之后,融合kernel和多流并行工法,推理时延与吞吐性能大幅优化,使长文本场景的处理能力直接跨入快车道。

英伟达CEO黄仁勋曾警告过,若DeepSeek在华为芯片上跑通并对全国产算力生态产生巨大影响力,那将是美国产业界一段非常可怕的结果。

如今,这个在他口中形容为“灾难”的预言,正在一一应验。

而另一个令巨头们忌惮的事实,来自调用量数据。

根据OpenRouter的跟踪看板,4月25日当天,DeepSeekV4的调用量汹涌上涨了将近4倍,出现绝对的碾压之势。

数以万计的中小企业开发者与高校微创团队正用实际迁移的行动投下了一句无声的标语:你可以继续坚持高价,但我也真的会走。

如此便宜,怎么跨过商业化的大山?

对于DeepSeekV4重新大杀四方,事情的另一面,藏在热闹的数据和欢呼的开发者背后。

据多家媒体的深入统计,在DeepSeekV4长达58页的技术报告结尾,“研究与工程”作者名单中,竟有10人标注了“已离职”。这些人才涵盖基座模型、推理、OCR、多模态四条核心技术主线。

图源:每日经济新闻

包括推起DeepSeek第一代大语言模型的核心作者王炳宣留下了一封简短的内部告别信,随后被证实他的去向是腾讯;

V2与V3核心模型的关键贡献者罗福莉,在小米创始人雷军的亲自下场游说下,以千万年薪加盟;

多模态旗舰项目Janus-Pro负责人阮翀出任了自动驾驶独角兽元戎启行的首席科学家;

就连整合R1核心逻辑的Agent方向开拓者郭达雅也转投字节跳动的Seed团队,坐镇并担任Agent方向负责人的关键之位。

没有多少人能想象,一个在顶尖AI赛道上一骑绝尘的公司,正在为高薪挖角的持续流失付出代价。

根据业内分析,DeepSeek目前已近一年无外部融资,所有未兑现的长期期权在账面值上可能是天文数字,但却缺少估值落地与变现的可能。

而当阿里、腾讯和字节等科技大厂开始对所有大模型人才进行系统性“扫货”的时候,那些偏居一隅的梦想,终究抵不过几行精准的数字合同。

此外,DeepSeek-V4虽然适配华为昇腾等国产芯片,目前现实是Pro版本存在相当棘手的“高端算力稀缺”,服务吞吐十分有限。

官方已在技术页脚标注说的很清楚,就算Pro的价格还会大幅下调,也要待到下半年昇腾950超节点批量上市后才能真正发生。

而在另外一极,OpenAI已经在ChatGPT中大规模试水广告模式,据外媒报道内部目标2026年实现2.4亿至2.5亿美元的广告收入,预计2027年推向110亿美元规模。

DeepSeek目前还没有如此清晰的变现替代路径。这或许才是DeepSeek和一众支持降价的人该面临的终极拷问:

你可能真的把AI做到了“白菜价”,但“白菜”本身,该怎么卖出可持续的利润?

没人知道这场降价的终点在哪。目前Pro版还在限时优惠,5月5日之后会不会回弹?下半年昇腾950批量上市后,价格还会不会再往下?这些答案,或许比两分钱本身更值得期待。

多年以后,当人们回忆AI落地最疯狂的那个黄昏,或许会想起OpenRouter排行榜上DeepSeekV4爆发式曲线高高跃起的立柱,以及那个被DeepSeek用零利润逼近的胆魄拉开的“AI水电煤”加速时代。

作者|刘峰

更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/