“感觉这又是一场工业革命。”


这是网络上关于几天前OpenAI发布文字生成视频工具Sora制作的短片后最常看到的一种评论。


根据OpenAI发布的研究和演示片段,只需要给Sora一段几十个单词的文字指令,它就可以生成一段时长达到一分钟的短片,短片类型既有真人也有动画,同时也有各种不同的题材与表现形式。


这意味着在不久的将来,只要有能力尝试这一工具(大概率需要付费),那么,任何人都可以生产出自己想要的视频作品,换言之,影视创作的门槛不说完全不存在,却实实在在地降到了最低。


Sora生成的短片


“工业革命”的说法或许有些过于标题党。但相对于Runway、Pica等目前流行的文字生成视频工具,Sora的确又往前跨越了一大步——要生成超过一定时长的视频内容,即AI工具必须对我们生活的物理世界有相当认识,或至少是有模拟相关物理规则的能力。


这也是Sora让全世界惊讶的一点,不仅呈现效果惊人,同时一上来就能够制作一分钟时长的视频内容。


可以说Sora的出现,再一次让AIGC的创作能力来到了新的境界,尤其是直接进犯了人类创作的终极领域——专业级视频内容。


过去几年里,国内外的影视公司都在大力投入虚拟制作,力图让实景拍摄最终都能被虚拟现实替代,然而,随着AIGC工具的跨越式发展,这些前期投入不菲同时又有极高学习和使用成本的虚拟制作还有存在的必要吗?抑或借助AIGC,虚拟制作能实现进一步的跃升,从而迎接那个影视拍摄不再需要外景也不再依赖后期特效时代的到来。


虚拟制作的反思:距离降本增效尚需时日


自从2020年的《曼达洛人》带动了虚拟制作的这一影视行业的新技术之后,国内长视频几乎是前赴后继地参与到了这场影视工业化的革命大潮,壹娱观察也曾在多篇文章中,反复提到了虚拟制作的特点。


当下定义的“虚拟制作”,核心其实就是将提前制作好的数字场景投映到LED屏幕上,让演员置身于这面随着视点位置随时变化的“LED屏幕”(尺寸大小不限)中进行表演。


另一头则是利用像虚幻引擎这样的游戏引擎工具,实现图像输出和摄影机追踪的同步结合,也就是说摄影机取景框在虚拟环境下拍到的画面,就如同在实景中拍摄那样,能够“所见即所得”。


在《曼达洛人》《新·蝙蝠侠》《龙之家族》等好莱坞大作之后,国内的《流浪地球2》《长空之王》等电影,以及长视频自制剧《云之羽》《狐妖小红娘》《清明上河图密码》《繁花》等作品也都使用了平台各自搭建的虚拟制作技术流程。


而从过去两年的快速发展和最终的成品质感中,不难总结出当下虚拟制作的优缺点。


优势:


  • 提高效率和降低成本:虚拟制片可以减少实景拍摄的时间和成本,例如无需搭建场景、寻找外景地等。


  • 提升创意控制:虚拟制片可以实现任何场景和特效,不受现实条件的限制,例如可以模拟外太空、古装环境等场景。


  • 增加安全性:虚拟制片可以避免实景拍摄中的安全风险,例如拍摄爆炸、火灾等场景。


劣势:


  • 技术门槛过高:虚拟制片需要专业的技术团队和设备,对技术人员的技能要求较高。


  • 创造性不足:一些人认为虚拟制片缺乏实景拍摄的质感和真实感,容易流于形式化。


  • 成本高昂:虚拟制片的初期投入成本较高,需要大量的硬件采购、软件流程优化和专业人员参与。


事实上,壹娱观察也曾在《虚拟制作从0到X,是时候该反思了》一文中提到过,在疫情打乱了好莱坞的制作流程时,虚拟制作的确起到了非常重要的补充作用。但随着这一阶段过去,不少大制作其实也已经回到了实拍的传统流程上,像是《沙丘》系列这样的高成本科幻大片,导演维伦纽瓦依然还是选择了实拍,更不用说诺兰去年叫好又叫座的《奥本海默》。


同时,虚拟制作居高不下的使用成本,也成为了流媒体平台很难过于依赖新技术的一个原因,毕竟这类新技术都需要规模化来平摊成本,但现实则是,即使是Netflix这样拥有庞大产量的平台,也并没有那么多作品值得用上这一技术,像是专门为其搭建了全套虚拟制作平台的《1899》,一季过后便被砍掉,显然,高昂的技术投入都成为了沉没成本。


那么,像Sora这类文字直接生成视频的AIGC工具,能够成为虚拟制作的平替吗?


AIGC增强后的虚拟制作,或许是最终答案


从目前来看大概不能,并且很可能永远也不行。


因为AIGC再强也不能无法把真人演员的表演也融入到其生成内容中去,但就虚拟制作的流程来看,一旦足够好用的AIGC工具真正问世,无疑将会极大地优化虚拟制作的准备流程和使用成本,两者的互补大概才会是趋势。


就目前Sora展现出来的能力,其实不难总结出AIGC工具在影视创作语境下的优势:


其一,速度和创意:AIGC在快速生成视觉想法和变化方面表现出色。虽然由AI生成的图像和视频缺乏专业VFX作品的质量,但它们在快速探索潜在镜头或场景设计方面表现出色。一旦创作者有什么想法,只需要打字就能够马上看到效果。


各大模型生成的“女人眨眼睛”的视频


其二,高度适应性:通过对环境和数字资产进行基于文本的修改,AIGC为在制作过程中实现新的灵活性和动态调整提供了潜在的可能性。像是OpenAI展示的那样,不改变核心要素的情况下,只需要调整与环境有关的提示词就能够直接展现出不同的变化效果。


其三,泛用性:这类AIGC无疑大大降低了传统VFX培养所造成的超高使用门槛,可能使较小的创意团队甚至业余爱好者参与利用数字环境进行影视级制作。而对于真正拥有VFX经验的专业人士而言,这类工具自然能明显降低其工作强度,毕竟VFX制作行业人力资源和工作量严重不对称已经是全球问题。


将AIGC视频工具和虚拟制作互补的好处,想象以下场景便不难看出二者相结合使用的强大力量:


图源:Sora技术报告


1. 早期预览:导演对一个场景有一个视觉想法。AI根据文本描述快速生成不算精细但具有想象力的可用动态图像,这些可视化图像有助于为虚拟制作上的详细环境建设和拍摄列表制定指导。


2. 临时创意修改:在LED环幕等硬件上创造一个场景时,一旦出现类似:“如果建筑物有一个哥特风格的阳台会怎样?”的想法时,与其要求VFX工作人员从零开始进行复杂的数字资产创建,不如使用AI生成的图像迅速探索这一想法的实际效果,供导演决定是否要使用这一场景。


3. 增加多样性:场景需要背景车辆或群演角色。使用预制数字资产和AI无限生成的多样性结合进行定制,可以快速填充场景,而无需进行昂贵的单独建模和动画制作。


事实上,即便现在Sora还尚未商用,这类利用AI来快速制作后期特效数字资产的创作方法就已经出现了。优酷不久前开播的《大唐狄公案》中的长安城画面,如人流、街景、楼宇建筑等均由AI辅助生成,虽然不知道这部剧是否也使用虚拟制作的流程来进行拍摄,但是这种思路其实是一脉相承的,利用AIGC工具来完成过去需要大量后期特效才能实现的内容。


换到虚拟制作中其实也只是让AI的参与从后期变成前置,并且可以有效利用其更加高效的特点去快速试错,以实现最终的画面呈现。


当然,就像虚拟制作的成本需要规模化使用来摊薄,目前像Sora这样的“尖端工具”,使用成本同样不菲,像Sora生成一分钟长度、每秒30帧的视频,按照TFLOPS换算约等于5500块A100同时运算的算力,这大概也是为什么目前Sora也还只提供极小范围的内部测试,之后推出大概率也会是订阅制服务。


不管是优爱腾芒自己投资搭建的虚拟制作摄影棚,还是现在市面上大量提供虚拟制作的后期制作公司,一个最直观的问题就是,大量采购的硬件成本其实已经投入了,相对应的生成管线和流程也早就开始磨合并形成了生产力,没理由在当下停滞不前或是直接放弃,原地等待AIGC成熟更不是现实的做法。


更重要的是,对长视频们来说,不论技术能力还是主要资源都不可能完全投入到AIGC的原生开发中去。


作为直接面向用户的平台,它们要做的只是等到足够好的商用工具出现即可,在AIGC没法一键生成一个好剧本之前,作为内容供应商过度纠结于AI技术的好坏其实并没有多大意义,观众最终只会为好剧或好电影付费。


本文来自微信公众号:壹娱观察(ID:yiyuguancha),作者:大娱乐家