去创作

用微信扫描二维码

分享至好友和朋友圈

雷军一鸣惊人,小米大模型杀进全球第一梯队

就在今天,雷军亲自曝光,小米的大模型突然冲上了全球榜单前列。

他在微博上轻描淡写地说:“我们在AI领域上相对比较低调,但实际进展可能比大家看到的快很多。”

据悉,小米自研的MiMo大模型在OpenRouter平台上拿下了周榜第一,在全球权威评测Artificial Analysis上位列第八。按品牌排名,小米已经进入全球前五。

图源:微博

更戏剧性的是,这个模型最初是“匿名发布”的。

它在海外平台上以“Hunter Alpha”的代号悄悄上线,结果开发者们用着用着发现:这玩意儿挺好用啊!

一度导致有人猜是这是DeepSeek的新版本,有人以为是某个国外大厂的试验品。直到三天后雷军出来认领,大家才反应过来:原来是小米大模型。

不少网友直呼:“又被他装到了。”

小米大模型怎么做到的?

我们先来看看这个模型到底有多能打。

在OpenRouter这个平台上,汇集了全球各大厂商的大模型API,开发者可以自由调用、对比效果。

这里的排行榜很直接——谁的调用量高,谁就排前面,做不了假。MiMo-V2-Pro上线后,先冲上日榜第一,然后是周榜第一。

图源:微博

如果你要问开发者们为什么愿意用?很简单,就是好用。

有做AI应用的程序员在社交平台上分享:“试了一圈模型,这个处理复杂指令特别稳,给的任务基本都能完成,关键是速度还挺快。”也有开发者评价:“智商在线,情商也在线。”

图源:X

那这个模型到底有什么特别之处?

简单来说,它是一个万亿参数的MoE模型。

MoE是“混合专家模型”的缩写,意思是把一个超大的模型拆分成多个“专家模块”,来任务的时候,只激活其中一部分相关专家干活。这样既能保证能力足够强,又不会让算力成本爆炸。MiMo-V2-Pro总参数高达1万亿,但每次实际调用的只有420亿参数,效率和能力找到了一个平衡点。

更关键的是,它特别适合智能体场景。

什么是智能体?你可以理解为一个能自主完成任务的AI助手。

比如你让它“帮我查一下下周去北京的机票,对比一下价格,然后订最便宜的那张”,它能自己规划步骤、调用工具、执行操作,最后把结果反馈给你。这跟以前的聊天机器人完全是两码事。

MiMo-V2-Pro在专门测试智能体能力的OpenClaw评测中,表现已经接近Claude和GPT这些国际顶尖模型。这才是它真正能打的地方。

图源:X

那问题来了:小米是怎么做到的?

负责这个项目的罗福莉说了句话很有意思:“骨干网和基础设施研究周期很长,需要一年的战略决心才能看到回报。”言下之意,这不是临时抱佛脚,是早就开始布局了。

她在社交媒体上回忆了一个细节:当她第一次体验到复杂的智能体框架时,想让团队都用起来,但一开始没人动。

于是她下了条“死命令”:“MiMo团队里,明天对话次数少于100次的可以辞职了。”

结果大家全在用,用着用着就发现这东西确实厉害,想象力被激发了,研究速度也跟上来了。

这种近乎偏执的执行力,或许就是小米能快速追赶的原因之一。

为了技术突破,雷军用了“最笨”的招数

当然,光有执行力不够,还得有真金白银的投入。

雷军明确说了,小米在AI领域今年要投入超过160亿元。对于很多AI初创公司来说,这种程度的投入相较于几千万的融资几千万简直没法相提并论。小米是真往里砸钱!

那钱花在哪儿了?主要有几个方向。

第一是算力。训练万亿参数的大模型,需要海量的GPU集群。这玩意儿现在全球都缺,价格还贵。小米能做出这个级别的模型,说明算力底子已经打好了。

第二是人才。罗福莉本人就是从DeepSeek过来的,参与过R1模型的构建。她在组建团队时,招的都是真正懂技术、有好奇心、能快速迭代的人。用她的话说,需要的是“产品直觉驱动评估,迭代周期缩短,范式转变及早发生”的能力。

图源:快科技

第三是数据。大模型本质上是用海量数据“喂”出来的。小米有个天然优势——手里有超过10亿台IoT设备在跑。这些设备每天都在产生大量真实场景的数据,足以用来训练模型的理解能力。这种数据壁垒,是很多纯软件公司不具备的。

除了MiMo-V2-Pro,小米这次还发布了另外两款模型:MiMo-V2-Omni和MiMo-V2-TTS。

V2-Omni是个全模态模型,什么意思?它能同时理解文本、图像、语音、视频。比如给它一段视频,它能识别出环境声音、分辨谁在说话,还能理解画面内容。

而它的能力在评测中已经超过了Google的Gemini 3 Pro。

并且它还接入了金山办公的WPS,可以根据指令直接生成Word文档、做Excel表格、排版PPT。

图源:微博

V2-TTS则是语音合成模型,能把文字转换成自然流畅的语音。

三个模型,三位一体,构成了小米目前在AI时代的基础能力矩阵。

罗福莉还承诺,等模型足够稳定,会把部分版本开源。这意味着小米不只是自己做,还想带动整个生态一起玩。

罗福莉在长文最后写了一段话:“当你所创造的模型开始真正帮助人们解决问题时,那种满足感是难以言喻的。还有一点很容易被低估——对你所创造的世界的真挚热爱。”

这句话或许能解释,为什么小米能在这个时间点冲出来。技术的突破背后,有投入、有执行力、有战略眼光,也有那么一点“就是想做成这件事”的劲儿。

雷军的终极野心:AI融入“人车家”生态

技术突破是一回事,怎么用起来是另一回事。小米大模型的真正野心,不在于在榜单上拿第几,而在于如何落地到“人车家全生态”里。

很多人可能没意识到,小米是目前全球唯一同时大规模生产智能手机、智能家电、智能汽车的公司。这三块业务加起来,构成了一个超级丰富的应用场景。

先说家里。在今年AWE展会上,小米展示了一套由大模型驱动的全屋智能系统Miloco。

以前智能家居要你下指令:“小爱同学,打开空调,调到26度。”现在不一样了,系统能理解日常生活的语境。你说“有点热”,它就知道调温度;你坐沙发上拿起遥控器,它就知道你想看电视。甚至不用说话,视觉感知就能触发智能规则。

雷军管这叫“有温度、能思考的家庭大脑”。小米全球AIoT连接设备已经超过10亿台,覆盖200多个产品品类。这么多设备接入后,AI就有了用武之地。

再说车里。小米汽车的智能化程度本身就不低,HAD辅助驾驶系统也在持续升级。车是一个移动空间,对语音交互、环境感知的要求很高。

MiMo大模型接入后,可以让车更懂用户的需求。

比如你说“找个充电桩,顺便推荐附近能吃饭的地方”,它能结合位置信息、充电桩状态、餐厅评价,给出一个综合方案。

最后是手机。手机是最随身携带的智能设备,也是AI能力最直接的载体。

MiMo模型已经整合进小米的手机和电脑,支持miclaw智能体、小米浏览器等应用。

以后你在手机上操作,很多重复性的事情可能就不用自己动手了,AI帮你搞定。

说白了,这三块业务无论从逻辑还是从现实来说都不可能是孤立的,AI能力的攀升,让三大业务的打通变得水到渠成。

高盛最近发了一份报告,把小米从“硬件厂商”重新定位为“拥有自主AI、操作系统及芯片能力的实体AI领导者”。虽然这个评价听起来有点宏大,但逻辑是通的:如果AI最终要跟物理世界深度融合,那拥有最多物理设备入口的公司,确实有天然优势。

当然,挑战也很现实。

最大的考验就是成本投入。手机、汽车、AI,哪个都需要烧钱,都需要人力。小米能不能保持持续投入,是个考验。

其次是技术落地的速度。榜单排名是一回事,真正让用户天天用起来是另一回事。从实验室到真实场景,中间还有很多坑要填。

最后,市场竞争加剧。全球大模型赛道已经挤满了玩家,OpenAI、Google、Meta、字节跳动、阿里……个个都不好对付。

小米能冲进前五,但能不能稳住,还得看后续迭代的速度。

作者 | 刘峰


更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/