去创作

用微信扫描二维码

分享至好友和朋友圈

阿里自研AI芯片“真武”曝光,性能追平英伟达H20

千问大模型每天要处理多少用户请求?这个数字恐怕连阿里自己都难以精确统计。但如今,支撑这些海量计算的,已不再是清一色的英伟达GPU。

就在今天,阿里巴巴旗下半导体公司“平头哥”官网悄然上线了名为“真武810E”的高端AI芯片。

图源:平头哥

这款此前经央视《新闻联播》曝光的PPU,官方参数显示其整体性能与英伟达H20相当,标志着阿里成为全球第二家实现大模型研发、云计算平台与AI芯片全链条自主设计与制造的科技企业。

阿里“真武”亮剑

根据披露的技术参数,“真武810E”配备了96GB的HBM2e高带宽内存,芯片间互联带宽高达700GB/s,支持PCIe5.0接口,整卡功耗控制在400W左右。

而对比来看,英伟达H20的卖点正是其96GB的HBM3内存和900GB/s的NVLink带宽,功耗却高达550W。

可以说,阿里的“真武”在显存容量上完成了对齐,在互联带宽上达到了H20的75%以上,并大幅超越了之前的A800。

这背后传递出一个冷峻的现实:国产芯片厂商已经放弃了在“单卡绝对峰值算力”上与英伟达H100/H200死磕(受限于制造工艺和制程),转而寻找一种更务实的“系统级平衡”。

阿里很清楚,如果能在通信带宽上咬住英伟达,通过万卡集群的规模效应,完全可以弥补单片性能的微弱差距。

图源:《财经》杂志

另一方面,“真武”之所以被称为PPU(ParallelProcessingUnit,并行处理器),而非传统的GPU(图形处理器),是因为它从设计之初就剥离了图形渲染等冗余功能。

作为阿里全栈自研的产物,“真武”在硬件架构上针对Transformer结构的大模型做了深度优化。

在同等算力指标下,运行通义千问(Qwen)等模型的效率,会由于底层指令集的匹配而获得额外加成。这种“专芯专用”的思路,正是阿里敢于对标英伟达的底气所在。

不过,我们也必须客观看到,在HBM技术路径上,阿里选择的是HBM2e而非最先进的HBM3/3e。

但这不叫“落后”,而是一种基于供应链安全的防御性选择。

当前全球HBM产能高度紧张,且先进制程封装(CoWoS)依然是扼住国产芯片咽喉的绳索。

阿里通过自研并行计算架构,试图用更成熟的封装工艺和内存方案,实现接近顶尖芯片的效果,这叫“工程学上的最优折中”。

从“平头哥”到“通云哥”,阿里的铁三角阳谋

如果只看芯片,我们看到的只是孤岛。

但如果把平头哥放在阿里巴巴的整体版图中,你会发现一个名为“通云哥”的庞然大物正在成型。

所谓“通云哥”,即:通义大模型+阿里云+平头哥。这个组合在全球范围内,只有谷歌(TPU+GoogleCloud+Gemini)能与之完全对应。

甚至连英伟达,在缺乏自研大模型和顶级公有云业务的闭环下,在生态纵深上也略逊一筹。

图源:每日经济新闻

而这背后,是阿里长达17年持续战略投入的结果:

从2009年创建阿里云,到2018年收购中天微并成立平头哥芯片公司,再到2019年启动大模型研究,阿里在关键技术领域的长期主义投入,终于在今天形成了协同效应。

相比单一环节的创新,这种全栈优化带来的效率提升和成本降低是几何级的。

在传统的采购模式下,阿里云购买英伟达的芯片,模型层调优算法。这种“拼积木”的方式在算力过剩时代没有问题。但现在,每一片芯片都价值连城,每一瓦功耗都影响利润。

因此,阿里自研芯片最大的优势就在于“软硬一体的深度调优”。

当通义实验室的算法专家发现某个算子在训练中存在瓶颈时,他们可以直接与平头哥的硬件工程师对话,在芯片层级进行优化——这是任何第三方芯片厂商无法提供的。

据业内估算,这种垂直整合带来的系统能效提升,往往能抵消制程落后带来的20%-30%的性能损耗。

然而,国产芯片最大的挑战不是“造不出来”,而是“没人敢用”。

阿里解决这个问题的办法很简单:自己先用。

目前,“真武”PPU已经在阿里云内部实现了多个万卡集群的部署。

背后的含义很清晰:当这款芯片真正推向市场时,它已经经历了淘宝双11的流量洪峰、千问大模型的万亿参数训练等种种高负荷场景的考验。

这种“自家果园实验,自家超市售卖”的模式,彻底解决了国产芯片的信任危机。据悉,国家电网、小鹏汽车等400多家客户已经开始采用阿里方案,本质上买的不是那一块硅片,而是阿里在那块硅片上跑通了的整套大模型基础设施。

长期以来,中国AI开发者一直活在CUDA生态的阴影下。英伟达最强大的护城河不是算力,而是其近乎垄断的底层软件生态。

阿里通过自研芯片和与之配套的软件栈,正在尝试构建一个基于国产算力的、可独立演进的生态支点。

如果“真武”能配合阿里云的算力调度系统,让开发者在不感知底层差异的情况下实现一键迁移,那么英伟达的护城河就出现了一道裂缝。

国产芯片冲刺IPO,仍需慎重

2026年初,平头哥、昆仑芯、摩尔线程等芯片巨头纷纷传出上市消息。客观来看,这不是资本的狂欢,更像是一场关于“存活”的赛跑。

众所周知,芯片研发是一个吞金兽。

平头哥成立8年来,依托阿里的海量投入,已经完成了从RISC-V架构(玄铁)、服务器CPU(倚天)到AI芯片(含光、真武)的全线布局。

但在阿里整体战略转向“更加敏捷”的背景下,平头哥的独立IPO就显得很有必要。

首先是降本增效。通过独立上市,平头哥可以利用资本市场的资金继续进行后续制程(如3nm/2nm)的研发,减轻母公司的现金流压力。

其次是去阿里化。作为独立实体,平头哥不仅能服务阿里云,更能以更加中立的身份去赢得竞争对手(如腾讯云、华为云或其他私有云客户)的订单。

只有成为“社会化产品”,国产芯片才能在真正的市场竞争中洗礼出生命力。

当然,这并不意味着我们在国际市场已经开始“遥遥领先”。

在狂热的讨论中,我们必须保持一份清醒。尽管“真武”在某些参数上比肩H20,但我们要意识到,H20本身就是英伟达为了适应贸易规则而划出的“天花板”。我们的“比肩”,在某种程度上是对比人家“退而求其次”的产品。

在单卡双精度浮点运算、先进光刻工艺的获取、以及全球开发者生态的粘性上,国产芯片依然面临漫长的追赶。

阿里的“真武”是一个极好的开端,它证明了我们在特定场景、特定架构下具备了与世界巨头掰手腕的能力,但这并不意味着我们已经可以高枕无忧。

未来的AI竞争,表面上是芯片性能的竞争,底层则是“算力能效比”的竞争,例如英伟达的Blackwell架构已经在追求单卡功耗超过1000W。

而对于中国而言,电力资源和碳中和目标决定了我们不能无止境地推高功耗。

阿里的机会在于,如何利用其在云计算调度上的积累,让算力像自来水一样,经过高效的处理和分配,以最低的成本触达企业。

如果“真武”芯片能配合阿里的液冷数据中心技术和分布式并行框架,实现比英伟达方案更优的“单位算力成本”,那么在商业逻辑上,阿里就赢了。

对于阿里巴巴而言,平头哥的独立与“真武”的s战,同样意味着它正在完成从一家“互联网公司”向“硬核AI基础设施供应商”的惊险一跃。

作者|刘峰

更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/