月之暗面突然出手，Kimi编程大模型拿下全球第一

科技头版

06-19 14:53 · 来自广东

Kimi与DeepSeek，狭路相逢的对手

图源：月之暗面GitHub项目

昨天，月之暗面向AI领域放了个大招。

它开源了Kimi-Dev-72B编程大模型，这个仅有72亿参数的模型，在SWE-bench测试（AI编程能力测试）中以60.4%的成绩超越了DeepSeek-R1。

图源：月之暗面GitHub项目

在此之前，5月28日发布的新版DeepSeek-R1凭借其671亿参数模型，曾是开源编程AI的标杆。如今，全球最强开源编程的宝座传到了kimi这里。

这场“以小博大”的胜利，打破了行业对“参数即性能”的固有认知。

Kimi-Dev-72B有这样的成绩，原因在于三个秘密武器。

第一个武器是双角色设计。

图源：月之暗面GitHub项目

AI可以同时扮演“Bug修复者”与“测试编写者”。

简单说就是能自己检查代码，自己验证修复是否正确。这样通过强化学习让模型在自我验证中进化。

第二个武器是强化学习优化。

AI能通过“试错”方式训练，只有真正修复了Bug并通过测试，才会得到奖励，确保AI的解决方案可靠。

第三个武器是高效的数据训练。

Kimi-Dev-72B用了1500亿条高质量GitHub代码数据，用定向训练更让其直击实际开发痛点。

通过这三个武器，Kimi-Dev-72B可以在代码修复、测试编写的精准度上占据优势，弥补和DeepSeek-R1在参数量上的差距。

对比kimi，DeepSeek-R1的技术路线更偏向通用编程，在数学推理等领域仍保持优势，但面对企业级代码修复需求时，Kimi-Dev-72B的化训练明显更胜一筹。

这种技术路线的差异，本质是“大而全”与“专而精”的战略分野。

图源：中国日报

时间拨回2024年，Kimi的崛起堪称营销教科书。

一般来说，大模型的应用分为B端和C端，前者是指面向企业或机构的商业应用，后者则是面向普通消费者的个人应用。

当国产大模型扎堆B端时，kimi以“200万字上下文窗口”切入C端，成为论文翻译、法律文档解析的办公神器，深受个人消费者的青睐。

Kimi的市场优势，加上一个月就高达1.99亿的广告投放，终于在去年11月砸出1282万月活，环比增长28%，在百度文心一言、阿里通义千问的夹击中杀出第三条路，仅次于百度文小言位居行业第二。

但2025年DeepSeek的横空出世完全颠覆了游戏规则。

凭借极低的训练成本和极高的性能表现，DeepSeek爆火出圈、震惊整个行业，零广告投入却靠技术口碑实现1.25亿用户增长，七天内收割1亿新用户，让行业看清了技术穿透力的真正威力。

此时的DeepSeek被称为“AI流量黑洞”。

而kimi的挑战还没结束。

3月下旬，腾讯元宝宣布完成重磅更新：同时接入DeepSeekV3-0324最新版，以及深度思考模型混元T1正式版。

腾讯财大气粗，广告投入比kimi只多不少。

今年一季度，AI产品的全行业投流费用约为18.4亿元，而腾讯元宝占比高达76%，仅在3月份，腾讯元宝投放费用达到11亿元。

图源：QuestMobile

QuestMobile数据显示，2025年3月DeepSeek以1.9亿月活登顶，腾讯元宝月活规模为0.4亿，而Kimi月活数量仅为0.18亿。

Kimi的滑落不仅是数字变化，更揭示了C端市场的底层逻辑变迁：

当AI从“新奇工具”变为“基础设施”，用户选择的核心标准已从“营销声量”转向“技术体验”。

DeepSeek的杀手锏之一是开源策略。其低成本模型不仅降低了企业接入门槛，更通过开发者生态快速积累用户。

当DeepSeek-R1成为行业标杆时，月之暗面终于在2025年6月调整策略，以MIT协议开源Kimi-Dev-72B，允许商业使用。

这种转变揭露了残酷的现实，在AI时代，技术优势若不能转化为生态优势，终将被开源浪潮淹没。

Kimi与月之暗面坎坷的发展历程

月之暗面这家2023年4月成立的AI公司，背后站着豪华的资本阵容。

从2024年B轮融资25亿美元，有阿里、腾讯等参投，到2025年估值升至30亿美元，美团、小红书加入，月之暗面的融资速度堪比火箭。

图源：虎嗅网

创始人杨植麟作为清华天才少年，带领曾任职谷歌、Meta的核心团队，构建了从长文本处理到多模态推理的技术护城河。

但资本加持也带来压力。

当DeepSeek以更低成本实现技术突破，月之暗面不得不重新审视商业化路径。

月之暗面B端依赖API接入、C端靠打赏模式的现状亟待改变，其接收小米“Kimi”商标转让、与华为合作搭载鸿蒙系统等动作，就是想在DeepSeek的压力下寻找新的盈利支点。

图源：天眼查

图源：月之暗面kimi微博

从2023年10月支持20万字处理的KimiChat，到2025年1月超越GPT-4的k1.5多模态模型，Kimi的技术进化从未停歇。

但真正的战略转向发生在今年：

4月份内测内容社区，模仿小红书设计打造AI生成内容生态；

在6月初开源编程模型，试图通过开发者生态破局。

这种从“工具”到“平台”的转型，本质是应对DeepSeek冲击的非对称策略。

当AI生成内容（AIGC）成为趋势，Kimi不再局限于工具属性，而是要做内容分发平台。

在平台上可以用AI抓取全网热点，kimi还邀请了邀请科技财经频道号入驻，这些动作直指DeepSeek技术强大但应用场景单一的短板。

图源：月之暗面kimi微博

换句话说，kimi的战略是，既然无法在开源技术上短期超越DeepSeek，就通过应用创新建立差异化优势。

不仅如此，月之暗面还在经历一场战略加减法。

减法是减少广告投放，将资源从营销转向技术。Kimi将模型推理服务降价83%，用性价比争夺企业客户；

加法是聚焦垂直场景。Kimi被清华北大纳入学术诚信工具包，在法律、教育领域深化应用。

但这样还不够，尚未盈利的月之暗面需要向投资人证明付费潜力，而C端用户对AI工具的付费意愿尚未完全打开。

内容社区能否通过广告、打赏实现变现？开源模型能否通过企业服务盈利？

这些问题的答案，将决定月之暗面能否在DeepSeek与阿里、腾讯等巨头的夹击中存活下来。

AI时代的生存法则

图源：微博

Kimi与DeepSeek的较量，本质是中国AI大模型行业的一个缩影。

在技术突破与商业落地的双重压力下，月之暗面的反击揭示了三个关键生存法则：

首先，技术专精度胜过参数规模。

Kimi-Dev-72B用72亿参数超越671亿参数模型的案例证明，谁能解决具体行业痛点，谁就能掌握主动权。

其次，生态构建能力决定生存空间。

DeepSeek的崛起印证了开源生态的力量，而Kimi的反击也显示闭源企业必须找到生态破局点。

无论是内容社区还是硬件集成，本质都是在构建“技术-应用-用户”的闭环，单靠技术优势难以维持长期竞争力。

最后，非对称创新创造突围机会。

当DeepSeek在技术层面对标GPT-4，Kimi选择从应用层突破，结合了内容社区、硬件集成、行业解决方案，这些非对称策略让其在巨头夹缝中找到生存空间。

AI行业的竞争从来不是线性比拼，而是多维战场的立体博弈。

站在2025年的时间节点，月之暗面的反击才刚刚开始。这家年轻的AI公司能否完成从“黑马”到“长跑者”的蜕变，还有待观瞻。

而对于整个行业而言，这场较量的终极意义或许在于，倒逼中国AI企业跳出“复制国外路径”的惯性，走出一条“技术创新+生态重构+商业落地”的独特道路。

在这条充满不确定性的赛道上，唯一能够确定的是，竞争从未如此激烈，机遇也从未如此临近。

作者|刘峰

更多精彩内容，关注云掌财经公众号（ID：yzcjapp）

以上内容仅供学习交流，不作为投资依据，据此操作风险自担。股市有风险，入市需谨慎！点击查看风险提示及免责声明

热股榜

代码/名称	现价	涨跌幅
加载中...

加载中 ...

月之暗面突然出手，Kimi编程大模型拿下全球第一

找回密码

用户反馈

云掌财经APP下载

月之暗面突然出手，Kimi编程大模型拿下全球第一

二维码已过期

使用云掌财经APP扫码登录

找回密码

用户反馈

云掌财经APP下载