去创作

用微信扫描二维码

分享至好友和朋友圈

月之暗面突然出手,Kimi编程大模型拿下全球第一

Kimi与DeepSeek,狭路相逢的对手

图源:月之暗面GitHub项目

昨天,月之暗面向AI领域放了个大招。

它开源了Kimi-Dev-72B编程大模型,这个仅有72亿参数的模型,在SWE-bench测试(AI编程能力测试)中以60.4%的成绩超越了DeepSeek-R1。

图源:月之暗面GitHub项目

在此之前,5月28日发布的新版DeepSeek-R1凭借其671亿参数模型,曾是开源编程AI的标杆。如今,全球最强开源编程的宝座传到了kimi这里。

这场“以小博大”的胜利,打破了行业对“参数即性能”的固有认知。

Kimi-Dev-72B有这样的成绩,原因在于三个秘密武器。

第一个武器是双角色设计。

图源:月之暗面GitHub项目

AI可以同时扮演“Bug修复者”与“测试编写者”。

简单说就是能自己检查代码,自己验证修复是否正确。这样通过强化学习让模型在自我验证中进化。

第二个武器是强化学习优化。

AI能通过“试错”方式训练,只有真正修复了Bug并通过测试,才会得到奖励,确保AI的解决方案可靠。

第三个武器是高效的数据训练。

Kimi-Dev-72B用了1500亿条高质量GitHub代码数据,用定向训练更让其直击实际开发痛点。

通过这三个武器,Kimi-Dev-72B可以在代码修复、测试编写的精准度上占据优势,弥补和DeepSeek-R1在参数量上的差距。

对比kimi,DeepSeek-R1的技术路线更偏向通用编程,在数学推理等领域仍保持优势,但面对企业级代码修复需求时,Kimi-Dev-72B的化训练明显更胜一筹。

这种技术路线的差异,本质是“大而全”与“专而精”的战略分野。

图源:中国日报

时间拨回2024年,Kimi的崛起堪称营销教科书。

一般来说,大模型的应用分为B端和C端,前者是指面向企业或机构的商业应用,后者则是面向普通消费者的个人应用。

当国产大模型扎堆B端时,kimi以“200万字上下文窗口”切入C端,成为论文翻译、法律文档解析的办公神器,深受个人消费者的青睐。

Kimi的市场优势,加上一个月就高达1.99亿的广告投放,终于在去年11月砸出1282万月活,环比增长28%,在百度文心一言、阿里通义千问的夹击中杀出第三条路,仅次于百度文小言位居行业第二。

但2025年DeepSeek的横空出世完全颠覆了游戏规则。

凭借极低的训练成本和极高的性能表现,DeepSeek爆火出圈、震惊整个行业,零广告投入却靠技术口碑实现1.25亿用户增长,七天内收割1亿新用户,让行业看清了技术穿透力的真正威力。

此时的DeepSeek被称为“AI流量黑洞”。

而kimi的挑战还没结束。

3月下旬,腾讯元宝宣布完成重磅更新:同时接入DeepSeekV3-0324最新版,以及深度思考模型混元T1正式版。

腾讯财大气粗,广告投入比kimi只多不少。

今年一季度,AI产品的全行业投流费用约为18.4亿元,而腾讯元宝占比高达76%,仅在3月份,腾讯元宝投放费用达到11亿元。

图源:QuestMobile

QuestMobile数据显示,2025年3月DeepSeek以1.9亿月活登顶,腾讯元宝月活规模为0.4亿,而Kimi月活数量仅为0.18亿。

Kimi的滑落不仅是数字变化,更揭示了C端市场的底层逻辑变迁:

当AI从“新奇工具”变为“基础设施”,用户选择的核心标准已从“营销声量”转向“技术体验”。

DeepSeek的杀手锏之一是开源策略。其低成本模型不仅降低了企业接入门槛,更通过开发者生态快速积累用户。

当DeepSeek-R1成为行业标杆时,月之暗面终于在2025年6月调整策略,以MIT协议开源Kimi-Dev-72B,允许商业使用。

这种转变揭露了残酷的现实,在AI时代,技术优势若不能转化为生态优势,终将被开源浪潮淹没。

Kimi与月之暗面坎坷的发展历程

月之暗面这家2023年4月成立的AI公司,背后站着豪华的资本阵容。

从2024年B轮融资25亿美元,有阿里、腾讯等参投,到2025年估值升至30亿美元,美团、小红书加入,月之暗面的融资速度堪比火箭。

图源:虎嗅网

创始人杨植麟作为清华天才少年,带领曾任职谷歌、Meta的核心团队,构建了从长文本处理到多模态推理的技术护城河。

但资本加持也带来压力。

当DeepSeek以更低成本实现技术突破,月之暗面不得不重新审视商业化路径。

月之暗面B端依赖API接入、C端靠打赏模式的现状亟待改变,其接收小米“Kimi”商标转让、与华为合作搭载鸿蒙系统等动作,就是想在DeepSeek的压力下寻找新的盈利支点。

图源:天眼查

图源:月之暗面kimi微博

从2023年10月支持20万字处理的KimiChat,到2025年1月超越GPT-4的k1.5多模态模型,Kimi的技术进化从未停歇。

但真正的战略转向发生在今年:

4月份内测内容社区,模仿小红书设计打造AI生成内容生态;

在6月初开源编程模型,试图通过开发者生态破局。

这种从“工具”到“平台”的转型,本质是应对DeepSeek冲击的非对称策略。

当AI生成内容(AIGC)成为趋势,Kimi不再局限于工具属性,而是要做内容分发平台。

在平台上可以用AI抓取全网热点,kimi还邀请了邀请科技财经频道号入驻,这些动作直指DeepSeek技术强大但应用场景单一的短板。

图源:月之暗面kimi微博

换句话说,kimi的战略是,既然无法在开源技术上短期超越DeepSeek,就通过应用创新建立差异化优势。

不仅如此,月之暗面还在经历一场战略加减法。

减法是减少广告投放,将资源从营销转向技术。Kimi将模型推理服务降价83%,用性价比争夺企业客户;

加法是聚焦垂直场景。Kimi被清华北大纳入学术诚信工具包,在法律、教育领域深化应用。

但这样还不够,尚未盈利的月之暗面需要向投资人证明付费潜力,而C端用户对AI工具的付费意愿尚未完全打开。

内容社区能否通过广告、打赏实现变现?开源模型能否通过企业服务盈利?

这些问题的答案,将决定月之暗面能否在DeepSeek与阿里、腾讯等巨头的夹击中存活下来。

AI时代的生存法则

图源:微博

Kimi与DeepSeek的较量,本质是中国AI大模型行业的一个缩影。

在技术突破与商业落地的双重压力下,月之暗面的反击揭示了三个关键生存法则:

首先,技术专精度胜过参数规模。

Kimi-Dev-72B用72亿参数超越671亿参数模型的案例证明,谁能解决具体行业痛点,谁就能掌握主动权。

其次,生态构建能力决定生存空间。

DeepSeek的崛起印证了开源生态的力量,而Kimi的反击也显示闭源企业必须找到生态破局点。

无论是内容社区还是硬件集成,本质都是在构建“技术-应用-用户”的闭环,单靠技术优势难以维持长期竞争力。

最后,非对称创新创造突围机会。

当DeepSeek在技术层面对标GPT-4,Kimi选择从应用层突破,结合了内容社区、硬件集成、行业解决方案,这些非对称策略让其在巨头夹缝中找到生存空间。

AI行业的竞争从来不是线性比拼,而是多维战场的立体博弈。

站在2025年的时间节点,月之暗面的反击才刚刚开始。这家年轻的AI公司能否完成从“黑马”到“长跑者”的蜕变,还有待观瞻。

而对于整个行业而言,这场较量的终极意义或许在于,倒逼中国AI企业跳出“复制国外路径”的惯性,走出一条“技术创新+生态重构+商业落地”的独特道路。

在这条充满不确定性的赛道上,唯一能够确定的是,竞争从未如此激烈,机遇也从未如此临近。

作者|刘峰

更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/