生成式人工智能又火了。

一夜之间,OpenAI开发的文生视频模型Sora,在全球掀起一场海啸。

从2月15号亮相到现在,中国大V和自媒体们已经给Sora叠上了一层又一层历史意义,似乎在没有赶上ChatGPT热度后,憋了一整年的金句、警句都要在这次宣泄出来。

从展示的视频看,Sora在技术上颠覆程度的确配得上这种流量“咖位”,可以说以一己之力改写了技术应用的时间表。

在它亮相前一天,摩根大通刚刚发布重磅研究报告,预测生成式人工智能在视频/3D游戏领域具备生产力还要等到2030年,一天后,人人都能拍好莱坞大片的未来好像已经触手可及。

被打脸的顶级投行可能会觉得很冤枉,因为基于过去一两年文生视频赛道的状况,无论巨头还是初创团队,在研发上都走得很缓慢,生成的视频时长不超过几秒钟,物体和场景动态变化很小,普遍存在物品或者属性缺失,不能进行连续优化修正,“灾难性遗忘”频繁出现,无法提取解耦的内容表征与运动信息,视频帧之间也缺乏内容关联性。

相比之下,Sora在视频时长、清晰度、提示理解能力、帧间连贯性上的表现是降维打击。



Sora为什么这么牛?

尽管OpenAI还没有公开技术文档,不过合理推测,它可能还是“大力出奇迹”的结果。

Sora是一种扩散模型(Diffusion models),这种模型在生成式AI上的应用,奠基于2020年华裔青年学者乔纳森·何(Jonathan Ho)提交的“去噪扩散概率模型(DDPM)”论文,自此之后短短两三年里,扩散模型已经取代生成对抗网络,一跃成为图像类生成式人工智能的最热门技术路线。

不过扩散模型效果虽然惊艳,但从热力学领域拿过来的模型本身却有着更高的计算复杂性,所以你会发现文生图、文生视频越来越不是一个学术问题,而是一个工程问题,好的工程能力比好的想法重要得多,目前,业界最耀眼的不是学术天才或者三两个人攒起来的初创公司,而是Meta、谷歌这些同时拥有成熟团队和算力资源的巨头。在这些巨头里,OpenAI的综合优势无疑是最强的,既拥有来自微软无限量的算力资源供应,又是生成式人工智能领域顶尖人才集散地,甚至扩散模型这条工程路线的开辟者乔纳森·何及其导师皮耶特·阿布比尔(Pieter Abbeel),也曾经是OpenAI的员工,所以Sora诞生在它家也就在情理之中了。



Sora生成的视频中舞龙截图


诚然,Sora本身确实很不一般,展现出非常接近商业化质感的视频输出能力,并且让人看到“世界模型”的潜力,资本当然也很愿意为这样的故事陪跑一段,所谓“早相信、早介入、早离场”,但这距离真正的产业落地,形成物理世界的生产力,还有一段距离。

核心的原因在于,即便经历了ChatGPT、Sora这样的标志性传播事件,生成式AI和消费场景结合仍然还有很长的路要去摸索,猎奇尝鲜和愿意持续付费显然是两个概念,当然,在和生产场景结合上,美国企业应用领域或者个人生产力工具的AI化正如火如荼展开,已经展示出提高服务业,尤其是金融、法律、编程这类高端服务业劳动生产率的巨大空间,但这些上层建筑的发展瓶颈,到底是供给侧还是需求侧呢?

事实上,丰富的落地场景,正是中国发展AI产业的长板之一。

中国AI产业的两大特点就是与硬件系统结合、与生产场景结合,所以我们会看到包括一众智能手机品牌、自主汽车品牌在内,硬件企业在国内生成式AI的研发上非常有存在感,华为无疑是其中最具公众认知度的代表,至于AI与各类生产制造、城市管理场景的结合,中国企业探索的广度和深度更是无出其右,比如智能制造领域,世界经济论坛评选的全球一百多家“灯塔工厂”里,就有四成左右来自于中国,堪称遥遥领先。

兜兜转转,生成式AI商业落地的上下求索中,硬件设备正越来越被重视,除了年初CES展会上大出风头的AI Pin、Rabbit R1,其实苹果的Vision Pro也可以被视为一个典型AI终端,包括数字分身、情绪检测、智能输入,都离不开AI技术赋能。

在国内,一众智能手机厂商也同样在以空前力度拥抱生成式AI,从去年鸿蒙小艺接入盘古大模型开始,主要手机品牌几乎均已官宣接入自研大模型,而节后开工第一天,OPPO创始人兼CEO陈明永就发表内部信,称2024年是AI手机元年。未来五年,AI对手机行业的影响完全可以比肩当年智能手机替代功能机,通过AI可以把手机体验重新做一遍,帮助用户实现更高价值。更激进的魅族则索性宣布停止传统智能手机新项目,All in AI,推出AI设备,包括XR形态的全天候AI Device。



硬件化,恐怕确实是生成式AI商业落地绕不开的路径,只有颠覆既有人机交互的形态和模式,才有希望找到AI充分施展优势的空间,而一旦进入到这条价值轨道的竞赛,你永远可以相信中国制造的竞争力。

AI芯片被美国人当成甩开中国竞争对手的“关键一招”,相比AI模型源代码,先进AI芯片无疑是更容易用来“卡脖子”的抓手,英伟达对华“特供版”AI芯片H20,正如其标号所显示的,和主流产品H100相比性能砍掉了80%,美国方面甚至还有动议要封杀中国企业使用亚马逊、谷歌云计算服务,堵住一切中国人获得算力资源的可能。



英伟达H100


在各种各样的段子里,在中国生成式AI产业俨然只是个骗子俱乐部,主要靠美国GPU加速卡、美国顶会论文和美国开源大模型忽悠投资人,Sora出世之后,中美AI产业差距将进一步拉大到无法追赶的程度。

但现实是,作为打压的副产品,中国集成电路产业界的需求空间被前所未有地打开,突围已经呼之欲出,除了华为新一代昇腾芯片越来越多的“蛛丝马迹”,在高端AI芯片不可或缺的HBM高带宽内存上,长鑫存储近期也公开了其技术储备。

人工智能是一场长跑,上世纪50年代以来,已经有过两起两落,中国在第一波没有赶上,第二波追上了一些,不仅在符号主义人工智能研究上取得了世界级成果,也赶上了神经网络研究的浪潮,在这一次第三波浪潮,中国到底是追近了还是被拉远了,答案是不言而喻的。

面对喧嚣,中国AI产业人和关心这件事的公众都有必要静下心来,能够见证人工智能这个新质生产力的普及,是我们这一代人的幸运。