字节有点着急了。

甚至等不到“年后再说”,在年味已经很浓的2月7日,字节跳动发生重大人事变动。

从0到1一手打造出抖-音的张楠,卸任抖-音集团CEO,转战剪映。

张楠本人在其朋友圈表示,接下来将用“始终创业的状态”负责剪映,“与这个AI的时代一起成长,共同绘制出脑海中的奇幻世界”。

公开报道显示,过去一年张楠已经将大多数精力放在剪映上,接下来将亲自带队推出一个AI生图和视频的产品。

AI生图和视频是过去一年多AI圈的高频词,也是一众科技企业大手笔投入的风口。

字节这次着急换帅,无疑是在积极追赶这个风口。

字节的AI之路:全力投入、内部赛马

“该有的大公司病全有了。”

这是字节跳动CEO梁汝波在1月30日的年度全员会上的发言,故此,梁汝波定下的2024年目标包括:加强危机感,始终创业,逃逸平庸的重力;业务上继续聚焦少量重要的事。

梁汝波表示,今天的字节正在变得迟钝,对机会的敏感度不如创业公司。他指出:“公司层面的半年度技术回顾,直到2023年才开始考虑GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的”。

故此,2023年底进行业务调整的同时,字节集中资源全力投入AI。

事实上,字节对AI的关注和投入虽然说不上早,但也并没有很晚。

始于2023年初的“百模大战”,字节并未错过。一年多来,字节也陆续发布了多款产品:比如大模型商城模式的“火山方舟”、AI对话类产品豆包和Cici(分别面向国内和海外市场)、文生视频应用Magic Video-V2、AI聊天机器人Coze等。

不难看出,字节正试图构建AI领域的生态。火山方舟是面向企业的服务平台,Magic Video-V2、豆包和Coze则主要是面向普通用户的应用产品。

但是,据《晚点Late Post》援引知情人士消息称,字节高层对目前的项目成果并不满意,已发布产品未达到预期。

作为当前中国互联网巨头中储备 AI 算力最多的公司,字节想要的显然更多。

沿袭一贯的赛马机制,字节对AI也是组建多个团队、立项多个项目同步进行。目前字节内部有多支团队参与 AI 创新业务,发力方向包括视觉、文字等领域的大模型,以及由Flow、Ocean等部门或团队打造应用层产品。

除了人才团队,字节跳动也砸入重金。一年前,字节就向英伟达订购了超过 10 亿美元的GPU。知情人透露,字节在AI战略重要程度提升之后,连申请采购 GPU时的投入产出比等必要性论证都弱化了。

尽管目前并没有人可以确定,下一个足以颠覆行业的AIGC产品是什么,会以怎样的样态面世又将如何改变内容生产与消费,但几乎全球科技圈都确定:AIGC是未来,不容错过的未来。

通往这个未来的路在何方,跟其他大厂一样,字节也在争分夺秒地摸着石头过河。

剪映换帅易,成为“抖-音”难

在AIGC的细分赛道中,AI文生视频被普遍认为是“AIGC的最后一块拼图”,是 AI 创作多模态的“圣杯”。正因如此,国内外的科技大厂或初创企业,都争先恐后涌入这一赛道。

图丨Runway创始人兼CEO Cristóbal Valenzuela 称:AI生成视频意味着一个更激动人心的时代的到来

一度执此牛耳的是Runway,这是一家成立于2018年的美国科技公司, 2023年 2月推出 Gen-1,可以改变视频原有风格,主打视频转视频;3月迭代为Gen-2,可以实现从文字、图像或视频片段生成新的视频。

正是被称为“史诗级更新”的Gen-2将这一领域的竞争推向白热化,参与的玩家持续提升AI生成视频应用的语义理解能力、视频生成效果以及输出稳定性等指标,并不断降低产品易用程度。

到2023年11月,初创仅8个月的Pika以其文生视频工具Pika 1.0迅速出圈,一跃成为备受追捧的“当红炸子鸡”。

除了这两个头部玩家,其他参与者也不遑多让。比如以文生图应用Stable Diffusion暴得大名的Stability AI也在11月发布了首个文生视频模型 Stable Video Diffusion,Meta(原Facebook,脸书)发布Emu Video,Google 则推出了VideoPoet,就连卖GPU的英伟达都推出了PYoCo。

图丨VideoPoet 生成视频

反观国内,这一领域进展相对较慢,相关产品要么尚处于初级阶段要么尚未正式上线,都没激起什么水花,更不用说明星产品和杀手级应用了。

字节跳动1月推出的MagicVideo-V2,支持4K、8K超高分辨率,声称测评效果超过Gen-2、Pika以及其他现有AI视频生成工具,但目前用户基础薄弱,前景尚不明朗。

在被普遍看好的AIGC浪潮面前,不颠覆别人就要被别人颠覆,而被颠覆恐怕是所有大公司的噩梦。

梁汝波也曾表示:“AI 技术对于内容创作会有很大的颠覆,甚至会产生新的创作平台。”

不差钱、一向信奉“大力出奇迹”的字节,此时加大在这一赛道的布局力度并不令人意外。

图丨剪映的主题特效AI生成功能演示

虽然剪映2019年5月才正式上线,但因为背靠抖-音这棵大树,很快因其“轻而易剪”吸引了大量视频内容创作者,随后又接连推出不同版本、不同端口的产品满足不同创作者的多样化需求,持续吸引用户。

在AI的应用方面,剪映早就推出语音识别/生成、文本生成、虚拟人生成、AI配音等基础AI功能,还持续推出智能抠图、主题特效、视频转手绘、图文成片、智能裁剪等进阶功能。进阶功能大都需要开通VIP会员才可以使用,这是其明确的变现渠道之一。

尽管目前这些功能的效果和满意度还有很大提升空间,但国内似乎也没有更好的替代选项。
数据显示,剪映的月活用户在2021年就已经突破1亿,成为国内最大的移动视频编辑产品。
同时,剪映海外版CapCut 2020年4月推出,但迄今其用户量已超过5亿人次,月活逾2亿,去年9月CapCut上的用户总支出突破1亿美元。

显然,借由剪映发力AIGC有强大的先天场景优势,其商业化路径也相对清晰。

图丨字节跳动张楠
张楠是一手打造抖-音、剪映的字节元老,在媒体公开报道中,多被塑造为善于调动资源、雷厉风行、执着的高管,长于管理和运营。

在抖-音增长进入平稳期,字节急需新的增长点之际,张楠投身AIGC风口,难免拉高期待:剪映能否被打造成下一个“抖-音”,成为字节角逐AIGC的现象级产品?

综前所述,从当前的内外情势来看,张楠有点难。

但久经沙场的张楠显然有充分的心理准备,在卸任抖-音CEO的内部信中,她已经表态:

我知道这会是一条很长的路,而且会有很多激烈的竞争,也会碰到技术不确定性带来的很多挑战和试错。但梦想总还是应该有的,如果不极致地试一次,未来该多遗憾呢。

道阻且长,但正所谓:有梦不觉天涯远,扬帆起航再出发。