月之暗面突然出手,Kimi编程大模型拿下全球第一
Kimi与DeepSeek,狭路相逢的对手
图源:月之暗面GitHub项目
昨天,月之暗面向AI领域放了个大招。
它开源了Kimi-Dev-72B编程大模型,这个仅有72亿参数的模型,在SWE-bench测试(AI编程能力测试)中以60.4%的成绩超越了DeepSeek-R1。
图源:月之暗面GitHub项目
在此之前,5月28日发布的新版DeepSeek-R1凭借其671亿参数模型,曾是开源编程AI的标杆。如今,全球最强开源编程的宝座传到了kimi这里。
这场“以小博大”的胜利,打破了行业对“参数即性能”的固有认知。
Kimi-Dev-72B有这样的成绩,原因在于三个秘密武器。
第一个武器是双角色设计。
图源:月之暗面GitHub项目
AI可以同时扮演“Bug修复者”与“测试编写者”。
简单说就是能自己检查代码,自己验证修复是否正确。这样通过强化学习让模型在自我验证中进化。
第二个武器是强化学习优化。
AI能通过“试错”方式训练,只有真正修复了Bug并通过测试,才会得到奖励,确保AI的解决方案可靠。
第三个武器是高效的数据训练。
Kimi-Dev-72B用了1500亿条高质量GitHub代码数据,用定向训练更让其直击实际开发痛点。
通过这三个武器,Kimi-Dev-72B可以在代码修复、测试编写的精准度上占据优势,弥补和DeepSeek-R1在参数量上的差距。
对比kimi,DeepSeek-R1的技术路线更偏向通用编程,在数学推理等领域仍保持优势,但面对企业级代码修复需求时,Kimi-Dev-72B的化训练明显更胜一筹。
这种技术路线的差异,本质是“大而全”与“专而精”的战略分野。
图源:中国日报
时间拨回2024年,Kimi的崛起堪称营销教科书。
一般来说,大模型的应用分为B端和C端,前者是指面向企业或机构的商业应用,后者则是面向普通消费者的个人应用。
当国产大模型扎堆B端时,kimi以“200万字上下文窗口”切入C端,成为论文翻译、法律文档解析的办公神器,深受个人消费者的青睐。
Kimi的市场优势,加上一个月就高达1.99亿的广告投放,终于在去年11月砸出1282万月活,环比增长28%,在百度文心一言、阿里通义千问的夹击中杀出第三条路,仅次于百度文小言位居行业第二。
但2025年DeepSeek的横空出世完全颠覆了游戏规则。
凭借极低的训练成本和极高的性能表现,DeepSeek爆火出圈、震惊整个行业,零广告投入却靠技术口碑实现1.25亿用户增长,七天内收割1亿新用户,让行业看清了技术穿透力的真正威力。
此时的DeepSeek被称为“AI流量黑洞”。
而kimi的挑战还没结束。
3月下旬,腾讯元宝宣布完成重磅更新:同时接入DeepSeekV3-0324最新版,以及深度思考模型混元T1正式版。
腾讯财大气粗,广告投入比kimi只多不少。
今年一季度,AI产品的全行业投流费用约为18.4亿元,而腾讯元宝占比高达76%,仅在3月份,腾讯元宝投放费用达到11亿元。
图源:QuestMobile
QuestMobile数据显示,2025年3月DeepSeek以1.9亿月活登顶,腾讯元宝月活规模为0.4亿,而Kimi月活数量仅为0.18亿。
Kimi的滑落不仅是数字变化,更揭示了C端市场的底层逻辑变迁:
当AI从“新奇工具”变为“基础设施”,用户选择的核心标准已从“营销声量”转向“技术体验”。
DeepSeek的杀手锏之一是开源策略。其低成本模型不仅降低了企业接入门槛,更通过开发者生态快速积累用户。
当DeepSeek-R1成为行业标杆时,月之暗面终于在2025年6月调整策略,以MIT协议开源Kimi-Dev-72B,允许商业使用。
这种转变揭露了残酷的现实,在AI时代,技术优势若不能转化为生态优势,终将被开源浪潮淹没。
Kimi与月之暗面坎坷的发展历程
月之暗面这家2023年4月成立的AI公司,背后站着豪华的资本阵容。
从2024年B轮融资25亿美元,有阿里、腾讯等参投,到2025年估值升至30亿美元,美团、小红书加入,月之暗面的融资速度堪比火箭。
图源:虎嗅网
创始人杨植麟作为清华天才少年,带领曾任职谷歌、Meta的核心团队,构建了从长文本处理到多模态推理的技术护城河。
但资本加持也带来压力。
当DeepSeek以更低成本实现技术突破,月之暗面不得不重新审视商业化路径。
月之暗面B端依赖API接入、C端靠打赏模式的现状亟待改变,其接收小米“Kimi”商标转让、与华为合作搭载鸿蒙系统等动作,就是想在DeepSeek的压力下寻找新的盈利支点。
图源:天眼查
图源:月之暗面kimi微博
从2023年10月支持20万字处理的KimiChat,到2025年1月超越GPT-4的k1.5多模态模型,Kimi的技术进化从未停歇。
但真正的战略转向发生在今年:
4月份内测内容社区,模仿小红书设计打造AI生成内容生态;
在6月初开源编程模型,试图通过开发者生态破局。
这种从“工具”到“平台”的转型,本质是应对DeepSeek冲击的非对称策略。
当AI生成内容(AIGC)成为趋势,Kimi不再局限于工具属性,而是要做内容分发平台。
在平台上可以用AI抓取全网热点,kimi还邀请了邀请科技财经频道号入驻,这些动作直指DeepSeek技术强大但应用场景单一的短板。
图源:月之暗面kimi微博
换句话说,kimi的战略是,既然无法在开源技术上短期超越DeepSeek,就通过应用创新建立差异化优势。
不仅如此,月之暗面还在经历一场战略加减法。
减法是减少广告投放,将资源从营销转向技术。Kimi将模型推理服务降价83%,用性价比争夺企业客户;
加法是聚焦垂直场景。Kimi被清华北大纳入学术诚信工具包,在法律、教育领域深化应用。
但这样还不够,尚未盈利的月之暗面需要向投资人证明付费潜力,而C端用户对AI工具的付费意愿尚未完全打开。
内容社区能否通过广告、打赏实现变现?开源模型能否通过企业服务盈利?
这些问题的答案,将决定月之暗面能否在DeepSeek与阿里、腾讯等巨头的夹击中存活下来。
AI时代的生存法则
图源:微博
Kimi与DeepSeek的较量,本质是中国AI大模型行业的一个缩影。
在技术突破与商业落地的双重压力下,月之暗面的反击揭示了三个关键生存法则:
首先,技术专精度胜过参数规模。
Kimi-Dev-72B用72亿参数超越671亿参数模型的案例证明,谁能解决具体行业痛点,谁就能掌握主动权。
其次,生态构建能力决定生存空间。
DeepSeek的崛起印证了开源生态的力量,而Kimi的反击也显示闭源企业必须找到生态破局点。
无论是内容社区还是硬件集成,本质都是在构建“技术-应用-用户”的闭环,单靠技术优势难以维持长期竞争力。
最后,非对称创新创造突围机会。
当DeepSeek在技术层面对标GPT-4,Kimi选择从应用层突破,结合了内容社区、硬件集成、行业解决方案,这些非对称策略让其在巨头夹缝中找到生存空间。
AI行业的竞争从来不是线性比拼,而是多维战场的立体博弈。
站在2025年的时间节点,月之暗面的反击才刚刚开始。这家年轻的AI公司能否完成从“黑马”到“长跑者”的蜕变,还有待观瞻。
而对于整个行业而言,这场较量的终极意义或许在于,倒逼中国AI企业跳出“复制国外路径”的惯性,走出一条“技术创新+生态重构+商业落地”的独特道路。
在这条充满不确定性的赛道上,唯一能够确定的是,竞争从未如此激烈,机遇也从未如此临近。
作者|刘峰
更多精彩内容,关注云掌财经公众号(ID:yzcjapp)
- 热股榜
-
代码/名称 现价 涨跌幅 加载中...