文 | 周天财经

周天财经 原创出品

五个没有一起开过黑的队友,却拿到了一场绵延数月的《王者荣耀》相关赛事冠军?

实际上,这支来自清华大学,名为「五杀蔡文姬」队伍的队员们,不仅没开过五黑,每个人的游戏水平也参差不一 —— 参与战斗的,是他们利用 「开悟平台」所开发的王者荣耀智能体。

是的,这是属于 AI 之间的战斗。

6 月 24 日,第二届腾讯 STAC 科创联合大会在成都举办,颁奖环节,「五杀蔡文姬」作为第二届腾讯多智能体强化学习大赛的冠军队伍,在现场领取了属于他们的优胜奖杯。

这可能是《王者荣耀》不为人知却意义非凡的另一面:数字游戏正在成为人工智能研究的前沿阵地,而在赛事的水面之下,还暗藏着人工智能产业需求转型,谋求未来增长的暗流涌动。

01 从「感知智能」转向「决策智能」的好生意

AI 是好生意吗?答案是肯定的。

从 2016 年至今,已有 40 多个国家和地区出台了与人工智能相关的战略政策与产业规划文件,全球人工智能进入战略布局加快、产业应用加速发展落地的阶段,而随着各项要素涌入,近十余年,人工智能的产业化进程大大加速,从实验室来到商业世界。

根据 IDC 发布数据统计,2022 年全球人工智能产业规模预计达到 4328 亿美元,到 2023 年将突破 5000 亿美元大关,而这还是基于软硬件及服务收入口径进行统计,如果将人工智能所撬动的经济增长计算在内,或将带来 10 倍于核心产值的效益。

一般来说,人工智能技术发展由浅到深可以划分为计算智能(Computing)、感知智能(Sense)、决策智能(Act)三个阶段;目前,人们身边的商业应用主要集中在「感知智能」层面,比如智能语音控制、人脸识别技术、医学影像识别等等。简言之,感知智能解决的,是「是什么」的问题,典型应用如亚马逊的 Alexa 以及 IBM 重金投入多年的沃森医疗 AI 等。

前瞻产业研究院发布的《2021 年中国家用智能视觉行业市场现状及发展前景分析》称,我国家用智能视觉市场高速增长,2020 年中国家用智能视觉产品市场规模为 331 亿元,2016-2020 年年复合增长率近 54%。

但是,感知智能并不是人工智能产业如今的「重头戏」。业界正在探索的是迈入「决策智能」阶段,计算速度更快、自动化程度更高的机器能够自动完成规则挖掘与学习分析,在「是什么」的基础上还知道要「怎么办」。

这显然是一块更加诱人的蛋糕——金融领域的智能投顾、制造领域的智能工业机器人、汽车领域的高级别自动驾驶以及医疗领域的新药研发、蛋白质结构分析等等,每一项背后都是万亿级的产业规模,它们都将随着「决策智能」照进现实而被彻底改造。

华经产业研究院发布的《2022-2027 年中国人工智能行业市场全景评估及投资方向研究报告》显示:截至 2020 年,决策类人工智能市场规模达 268 亿元,近 4 年年均复合增长率实现 83.5%,有望在 2025 年突破 1847 亿元。

如科幻电影《星际穿越》中无所不知,还能牺牲自己拯救主角的机器人「塔斯」,就常被视作「决策智能」一个未来目标。

故事令人憧憬,但「决策智能」的技术迭代与商业化路径并不存在画好的路线图。

02 技术与人才短板,需要怎样的「产业底座」

如今,人工智能科研的成本实在太过高昂。

OpenAI 在 2020 年发布「史上最强 AI 模型」GPT-3,这款参数高达 1750 亿的预训练模型真正诠释了「大力出奇迹」,几乎可以高质量的完成有关语言处理的绝大多数任务,比如机器翻译、语义推断、文章生成等等,直接带动行业进入到「大模型」时代。

但是,据业界测算,OpenAI 仅仅是在训练 GPT-3 的阶段就花费了 1200 万美元,训练语料庞大到难以想象。退一步说,即便是规模仅有 OpenAI 千分之一的训练预算,也会耗干绝大多数高校科研团队的预算。

况且,人才要素上的短板同样明显。

中国虽然已经处在世界人工智能研究的第一梯队,但是与美国相比任然有比较明显的差距,根据 AIMiner 最新发布的 AI2000 榜单,美国入选榜单的知名学者供给 1146 人次,占比 57.3%,中国位列第二,数量上为 232 人次,而在机构综合排名中,前 20 名的机构中国仅有香港大学 1 名上榜。

AI 2000学者国家分布

图源:AIMiner官网

由于 AI 技术的前沿特性,针对应用领域的人才培养需要很长的周期,并且技术提升十分依赖在真实环境中进行实践,不能只靠照本宣科。

这种人才培养整条链路上都需要补齐、供需缺口严重的情况,在中国尤其突出,中国在 2019 年经过教育部批准才在 35 所高校开设人工智能专业,起步时间短,教学环节的师资也严重匮乏。

尽管国内顶级高校在相关教学探索上已有不错成效,如清华「姚班」走出多位研究学者和 AI 独角兽创业者,北京大学的智能科学与技术专业设立已开设多个细分方向,但坦率地说,大部分高校只是将电子信息类与计算机科学类的课程重新组合,并未真正在智能技术的教学上取得突破,学校、老师与学生都是在「摸着石头过河」。

当前技术与人才上的瓶颈,说到底来自于我们仍未构建一套行之有效的基础设施,或者说「产业底座」。

人工智能不同于工业时代的技术演进,它的迭代速度太快,产业对于创新成果转化应用的需求又特别迫切,因此一个理想的「产业底座」,应当能够让产学研等要素低成本地接入、合作,并且高效率地产出符合产业实际需要的各项成果。

在国内外,有不少科技产业巨头与科研机构都在用自己的方式试图解决技术与人才上的瓶颈。

谷歌旗下的 DeepMind,广泛与顶尖高校合作,跨学科、跨领域的探索人工智能的可能性,在为人熟知的 AlphaGo、AlphaFold 之外,DeepMind 还有与瑞士洛桑联邦理工合作的 AI 在核聚变中应用的项目、与哈佛大学对动物神经结构的模拟项目等等。

又比如亚马逊、Meta、苹果、英伟达等大型科技公司,都在积极建立 AI 实验室,高薪聘请学界大牛担任主管,或是与高校机构保持长期资助关系。

这种跨区域的产学研合作不仅帮助企业建立更多维度的数据模型,也从科技伦理的角度收集到了多元反馈,部分研究者还会在项目结束后进入企业继续开展工作。

在国内也有这样的产学研项目正在开展,以此次腾讯 STAC 科创联合大会的举办地成都为例,作为国家划定的「第四极」,今年工信部宣布第二批国家人工智能创新应用先导区名单,成都成为全国八个先导区之一,也是西部地区第一个先导区。

在算力基础方面,成都拥有已经投入运营的超算中心和智算中心,并且地方政府还以市场化方式设立了成都市大数据集团,在创新应用先导区相关的人工智能平台建设项目评比之中,正是由大数据集团作为牵头大卫,联合腾讯云、成都超算中心、电子科技大学等 9 家人工智能领域机构组建为「产、学、研、用」联合体队伍成功中标。

也正是由于成都在科创领域的独特优势,今年 6 月初,腾讯与成都高新区签署合作协议,腾讯未来中心项目将在成都落地,共同探索全真互联网未来科技与场景建设。

腾讯西部创新创业中心

图源:成都市新经济发展委员会官网

除了政府牵头组局,提到成都的人工智能发展,不得不提的还有成都的游戏产业——育碧将成都作为继上海之后在中国的第二个落脚点,腾讯《王者荣耀》所在的天美工作室也位于成都。而《王者荣耀》本身,正在成为 AI 的极佳训练场。

基于国内人工智能的产业转型需求与趋势,《王者荣耀》给出了「游戏 +」的解题思路。

03 王者 AI 为「产业底座」贡献了什么

游戏与 AI 的联系远比大多数人想象的更紧密。

美国国防高级研究计划局,也就是大名鼎鼎的 DARPA 的一项名为 ADAPT 的战场辅助决策项目中,承包商 Aptima 公司就是利用游戏《我的世界》来训练 AI 去理解人类如何协同作战并完成任务,最终分析战场情况以减少指挥官的管理负担。

推出 AlphaGo 的 DeepMind 在解决了围棋算法之后,也选择了信息不完全,复杂度更高的策略游戏《星际争霸》来训练 AI AlphaStar,比围棋更加复杂的地方在于,AI 需要收集并理解更多维度的数据,并且不断迭代出相应的策略,比如资源开采、兵种配置、进攻时机等等,根据团队透露,早期版本的 AlphaStar 仅靠自我博弈,就提升到了接近人类玩家的水平,并在进一步训练后迅速超越了 99.8% 的人类玩家。

腾讯很早就开始开发《王者荣耀》在 AI 研究上的潜能,为许多玩家所熟知的「王者绝悟」就是王者荣耀团队与腾讯 AI Lab 团队合作探索的决策智能 AI;自 2017 年诞生以来,「王者绝悟」的水平不断提升,从监督学习到强化学习;更重要的是,多篇「王者绝悟」相关成果论文已被 AAAI、NeurIPS 等 AI 顶会收录。

千万不要以为「王者绝悟」只是用来丰富玩法、提升玩家体验的。王者绝悟底层的多智能体技术,本身就是一门「好生意」。

随着工业领域对智能化水平需求的提升,多智能体技术成为了工业互联网与人工智能技术交叉领域最前沿的研究热点,因为其技术在解决产业实际复杂问题时具有独特优势。

比如说,如今定制化制造的兴起,多品种、小批量的生产需求逐渐增多,尤其是在服装、小商品等快消品行业。但这种模式混合排产难度大,供应链协同较差,库存难以预测,关键物料的上下游订单接合常需要「救火式」加班。

而将具有自主学习能力的多智能体技术引入供应链报价和物料协商中,能够优化上下游连接企业的长供应链,实现物料、库存、物流、订单等的动态管理,增强产业集群对市场的反应能力,能够极大提高商家的生产与交易效率。

但有趣的是,王者荣耀与腾讯 AI Lab 似乎并没有追求多智能体这项技术的商业收益,而是选择了孵化了 AI 开放研究平台「开悟」,让高校、研究机构以及算法开发者能够利用开悟开展相关的多智能体算法研究、应用探索、成果交流等等。通过开放资源,尝试解决上文提到的产业技术与人才瓶颈。

经过近几年的完善,基于开悟平台,王者荣耀正在摸索出一条人工智能产学研合作的新通路,如同一条纽带,将人才、技术和产业三个方面联结起来。

从人才培养的角度来看,靠着与游戏相结合的研究思路,开悟的相关赛事能帮助更多学生「祛魅」,提升他们对科研的热情与积极性。况且,王者荣耀还与高校合作打磨课程内容,通过课程合作帮助更多学生打好强化学习相关的产业理论基础,扩大人才培养的惠及范围。

根据中智咨询《人工智能行业人才管理研究报告》,人工智能行业中的算法研究岗、应用开发岗人才供应极度紧张,供需比仅为 0.13 和 0.17,技术人才上的有限供给已经制约了产业发展,所需要的正是更多有理论基础、又有实践经验的人才供给。

来自中科大的赵鉴谈到,「在得知能够在《王者荣耀》里训练人工智能,周围同学的报名热情都很高涨」。目前,中科大还组建了 Game AI 社团,许多非强相关专业的学生也开始学 AI 知识。

而在技术层面,王者荣耀则是提供了「以赛促研」的破题思路。通过开悟平台,提供环境、算力、算法框架等方面的资源支持,让各支站队可以在复杂的游戏环境与真实对抗中不断训练自己研发的 AI。而无论是算力、算法还是环境场景,都是目前高校开展 AI 研究所稀缺的资源。

与此同时,王者荣耀还协同腾讯 AI Lab 一起积极接入产业合作,在 STAC 大会上发布了「腾讯 X 西南交通大学的智慧交通」合作项目,加快推动成都人工智能科技成果转化及产业应用落地。

授人以鱼不如授人以渔。与其闭门独造一个「王者绝悟」,不如通过开悟平台,让决定未来人工智能产业发展方向和高度的高新人才们,也有机会参与到 AI 的生态建设中来。这也许是做好一笔买卖,与做好一个「共赢」市场的区别。

学生获得的并非是一个成熟的决策型 AI,而是在寻求方法,验证理论,然后自己研发一个 AI。当这些经验积累下来之后,那么从游戏内走到游戏外,也只是时间问题罢了。

如陈华玉选手所提到的,「在游戏中能做好决策本身就极具意义,因为现实中绝大多数的问题都是决策问题,比如车路协同、比如化工厂大量的阀门控制,都可以抽象为决策问题」。

如前文华经产业研究院发布的报告所述,决策智能的商业前景十分理想。中商产业研究院发布的《2021 中国人工智能行业市场规模及细分行业市场预测分析》中也指出:虽然决策类人工智能在市场占比仅为 21%;但是,其也是目前人工智能市场中年均复合增长率最快的类别。

而在这其中,王者荣耀与腾讯 AI Lab 给出的游戏解法,是以开悟平台为核心,通过「课程讲理论 - 赛事磨技术 - 产业应用」的方式解决产业根源的人才与技术供给问题。

正如 STAC 大会上,文化和旅游部科技教育司原司长孙若风所谈到的,王者 AI 确定了以人工智能为核心、教育 + 产业为两翼的发展战略,发起建立人工智能科教联盟和人工智能科创联合体,通过交流赛事与课程合作,为高校师生提供技术、场景、平台支持与项目经验,对于游戏 AI 跨界应用有标杆性意义。

随着产学研环境良性发展,对能处理复杂决策的智能体的研究越发深入,「决策智能」的天花板才能被真正打开 —— 技术研究进步,商业应用落地,人才也能够以符合产业需要的方式得到训练、培养,届时所惠及的不但是人工智能产业,更将直接关系经济社会的进一步增长。

04 结语

回顾历史,游戏产业一直是应用推动生态发展的重要培育池,近几十年来,来自游戏的需求推动了软件、芯片、屏幕等技术一同前进。而在人工智能来到关键的转折点,游戏的意义又超越了娱乐休闲,成为撬动产业破局的关键变量。

这当然需要时间,但不断扩大的赛事规模和科研成果验证了「游戏 +」的可行性——来源于产业、服务于产业,在低成本且接入友好的前提下,还能够产出真正满足未来产业发展需要的研究成果。