人类艺术家与人工智能的交锋日益激烈,纠葛缠绕如火如荼。


去年,游戏设计师杰森·艾伦借助Midjourney模型生成了《太空歌剧院》,这是首个获得奖项的AI生成艺术作品,也是生成式人工智能在艺术界引发巨大震荡的导火索。


从游戏到动画,许多行业的画师们,都感受到前所未有的压力。与此同时,好莱坞编剧与演员的全面罢工,也与人类艺术家拒绝用自己的影像、声音和文字作品去训练AI,有着莫大关联。而近期,当代最著名的艺术家之一大卫·霍克尼宣布加入了使用生成式人工智能作画的队伍,他即将推出的AIGC作品,必将掀起新一轮的讨论热潮。


《太空歌剧院》成为首个获奖的AI生成艺术作品


层出不穷的应用让AIGC成为了艺术创作领域的风口与焦点。


在图像领域,如果说曾经利用GAN网络进行图像生成、图像修复、风格迁移,只是少部分专业人士的专属工具,那以Midjourney为代表的LLMs新兴应用的进化,让普罗大众可以用自然语言、通过在用户框输入文字的方式,生成图像作品,极大降低了艺术的门槛。


在视频制作领域,以GEN-2为代表的多模态人工智能系统,激发了用文本、图像或视频片段来生成崭新视频的可能;网上出现很多创作者,先用Midjourney生成图片,再用GEN-2生成镜头,将其剪辑成为视频。


在设计领域,AIGC也表现出强大潜力,比如在建筑领域已经开始出现各种应用,其在各个设计领域的广泛铺开只是个时间问题。


这些成果给人们带来了很多新奇与震撼,并被嗅觉敏锐的艺术从业者迅速转换为生产工具,也引发了人们的丰富联想与热切讨论,AI会不会彻底取代人类艺术家?本文试图将这个疑问转化为一个更具体的问题,即AIGC应用于艺术领域的“限度”在哪里:AI在艺术领域中能做什么,不能做什么?这涉及到几个要点:深度学习的原理机制所决定的AI的能力范围是什么?艺术概念在本文背景下有哪些相关内涵,以及心智哲学对AI主体地位的认定等。


在这些思考框架内,再来探讨AI能否改写艺术、取代人类艺术家,才更有指涉和反思的意义。


深度学习的原理机制


我们自AlphaGo开始热议的AI,其实都是基于深度学习技术的。深度学习的最大优势在于能让机器自己去发现海量数据中的规律和结构。它的实现机制,简单来说,是由训练者提供某个复杂领域里的大量样本,让机器用万能函数来拟合这些样本,以获得编码了样本特征的参数集,从而实现对样本的模式构建和结构刻画,建立起模型用以处理与训练样本同类的新样本。[1]


由此,我们可以看到关键的一点,训练的目的在于找到给定样本中的共同模式与结构,那么对于样本范围内的重复性问题,深度学习所建立的模型可以有效处理。但对于完全超出训练样本范围的新情况,这个模型就失效了。就像原初的AlphaGo可以从海量棋谱中拟合出围棋的取胜之道,却不能用来下五子棋。所以深度学习式AI擅长以“模仿”的方式处理那些并非简单的重复性工作。


我们生活中大部分工作都属于这种性质,AI得以被广泛应用也正是因为如此。但深度学习的原理又决定了AI很难进行从无到有的创造性活动,因为它的发挥空间并不能超出给定的样本范围,做出范式性突破。正是这个技术特性构成了AI在艺术领域的应用的根本限制。


深度学习被定义为基于人工神经网络的机器学习和人工智能的子集。[2]


另一方面,这些原理也决定了AI注定采用一种“外延式”处理方式。AI对于处理以结果为导向的问题非常有效,但并不像人类那样理解一个操作背后的含义。


塞尔的中文屋思想实验很好地展现了这一点。假设一个完全不懂中文的英语人士被关在一个房间里,手边有一本用英文写的关于如何排列中文符号的规则书。房外一个懂中文的人通过一个小窗口向房间里传递用中文写的问题。房间里的人则按照规则书的指示,从一堆中文符号中组合适当的符号作为答案传递出去。在房外的人看来房间里的人是懂中文的,但实际上房里的人只是在机械地执行规则书上的指令。后面我们将看到,这个技术特性也构成AI应用在艺术领域的限制。[3]


艺术概念的内涵


提到艺术,我们首先会想到的可能是画作。但一幅“画作”并不等同于作为物理物的画布与颜料,也并非色块的位置关系,甚至不是单纯的图像本身,而是前面这些因素叠加创作者和欣赏者特定的主观意向。


一个典型的例子是阿瑟·丹托在《寻常物的嬗变》中提到的。他设想了九块物理性质完全相同的红色画布,分别由九位不同的艺术家在不同时期以不同目的创作,并展示给不同的观众。因为处于不同的语境,作者与观者对同样图像有着不同赋义,因此这些红色块有的是肖像画,有的是风景画,有的是静物画,有的是抽象画……尽管它们在外观上看起来相同,但它们的艺术意义却完全不同。


甚至写实类作品也是如此。写实画作并不是机械复制,也并不存在一个客观标准来决定一幅写实画作的好坏,而依然依赖于作者和观者的主观评判,依赖于一个赋义的过程。也就是说,一幅画作不仅是物理和图像层面的,还与作者和观者的意向所指有关,而AI生成图像这个过程却不存在这个维度。


而在当代艺术中,这个特征更加明显。当代艺术突破了传统平面绘画形式,结合多种媒介和技术创造出丰富多样的艺术新形式。相比传统绘画注重画面形象的表现,当代艺术天然更注重于表达艺术家的思想,作品的意义和观念常常比其物理载体更加重要。最极端的如现成物艺术,其作为艺术作品的实现完全依赖于作者与观众在超越实物层面上的意领神会。艺术家倾向于借作品去探讨社会、政治、文化和哲学等议题,引发观众的思考与反响。当代艺术还往往以反传统为取向,不断打破既有艺术传统和固有观念的束缚而追求创新性和独特性。


媒介和形式的多样性以及对作品背后观念的强调都使得当代艺术极难从外延上被定义和把握。那么按照我们上面对深度学习原理的描述,这个关键的意义产生过程是AIGC所不涉及的。


换言之,AIGC的作品借助符号和图像的排列甚至可以对人类情感进行表征,但作品所传达出的情感却只是来自对人类情感表征方式的模仿,而不是人类情感的内涵本身。


2022年底,纽约现代艺术博物馆(MoMA)展示了特别展览项目《无人监控》(Unsupervised),呈现艺术家雷菲克·阿纳多尔利用人工智能演绎的馆藏艺术、设计和摄影作品,这些作品经过分析、数字化、输入算法后,在巨大的LED墙中呈现出来,被认为是机器的幻觉和梦境。[4]


心智哲学问题


我们可以发现,前面所强调的赋义能力和创造力与人类作者和观众作为意识主体有着密切联系,而AI缺失了这两种能力。这就关涉到一个更深层次的经典哲学问题,即AI是否可能具有意识并成为人类这样的意识主体,或者说,强人工智能目标能否实现?


一种流行的心智哲学观点——功能主义/计算主义——认为答案是肯定的,它们主张人类心智可以还原为拥有特定功能的计算结构;反之,如果特定计算结构能够实现人类心智的全部功能,那么也就可以认为这个程序具有了意识以及相应的伦理主体资格。很多科幻作品正是基于这个前提展开的。


但这个预设本身是富有争议的。如果计算主义为真,那么AI就能成为硅基的意识主体,并凭借其强大智能在艺术领域全面超越人类艺术家。那么在此讨论AI的应用限度就变成了一个伪问题。对计算主义的主要质疑和反对意见在于,除了计算等特定智能功能,人类意识的其他方面如情感、感觉、创造力等能不能被还原为计算结构?或如塞尔的中文屋思想实验想表明的那样,即使一台计算机能够在外在表现上像人类一样完美——譬如通过了图灵测试(图灵测试作为标准在目前的技术发展下已经过时),也不能证明它像人类一样真正理解了语言或具有相同的意识内容。当然,这又会引发计算主义者的反驳和批评……


在此我们并不打算展开心智哲学讨论。我们姑且认为,至少基于深度学习的AI暂时无法具有与人类等同的心智能力,特别是创造能力。这也是本文的立足点所在。基于这个前提,我们就可以去考察下AIGC在艺术领域的应用限度。


AIGC能做什么


我们可以确定,像很多其他领域一样,如工程领域,AI可以替代艺术实践中大部分的重复性工作。事实上,正如我们在开头提到的那样,AIGC已经得到了广泛应用或展现了强大潜力,由AI在这些领域承担大部分工作的愿景指日可待,同时作为工具助手,提高生产力。


我们完全可以想见AI如何广泛参与到当代艺术的创作中去。因为大部分当代艺术作品都由基于语言描述的作品方案转化而来,而ChatGPT这样的通用语言模型完全可以参与到作品方案的生成中去。虽然我们已经指出,当代艺术注重颠覆性而深度学习无法提供真正的突破,但在实践中,大部分当代艺术作品并不总是跳出既有艺术范式,所以AI依然可以为艺术家提供很大的帮助。


总的来说,AI在艺术领域的作用可以体现在三个方面:一是一些非创意性的技术性工作,替代艺术家的体力或低级脑力劳动,类似于艺术家的执行助手;二是为艺术家提供辅助性参考,无论是视觉图像还是文字方案,AI都可以提供一些前期材料,帮助艺术家扩展思路,激发灵感;三是降低了艺术门槛,使之前被认为是“外行”的人也可以参与进来,譬如让没有造型能力但有想法的爱好者用提示词来创作一幅画,或让没有拍摄条件的普通人自主生成一部电影。


微博网友@数字生命卡兹克用AI自制《流浪地球3》预告片,引起导演郭帆的亲自回复


AIGC的应用限度


另一方面,根据前述原理与概念分析,特别是基于深度学习式AI无法拥有人类所有心智能力的前提,我们可以看到AI在艺术领域的局限性所在。


我们提到,深度学习本质上是经验回溯式的,其在重复性工作领域的高效恰恰注定意味着其在创新领域的失效,其对既有艺术作品的充分模仿也意味着如此产生的作品注定失去了艺术强调的创新性。一件艺术作品只有不能被深度学习根据艺术史经验建立的模型所拟合,才算得上“创新之作”。因此深度学习式AI无论如何也无法产生出杜尚的《泉》这样划时代的作品。这种失效内在于深度学习原理机制和艺术概念本身,不可能随着算法改进而解决。


AI或可以完成一部作品中的很多步骤,但仍只是作为工具手段而存在,而无法承担作者责任,拥有作者权利。如同艺术家的助手参与了一件作品的制作却并不会因此成为作品的作者一样,那个确定了主题方向、下达了指令并敲定了作品最终效果的人才被认为是作品的作者。在借助AI进行的艺术创作中,AI可能能够提供出现成的图像或多个参考方案,而使用者只需略作修改甚至只需做出选择即可,但正是使用者提供的提示词以及做出的筛选和敲定才是让一幅图像成为他的一件作品的关键。正是这个过程实现了“创造”与“赋义”。


因为决定着作品质量依然是人为的选定,所以AI的铺开看似降低了操作层面的艺术门槛,但对于使用者的艺术素质要求并没有降低。AI能够产出什么样的作品,依然取决于使用者的艺术水平。缺乏专业素养的使用者并不能很好驾驭AI持续产出高质量作品,正如照相机本身并不会让照相机的使用者都成为摄影师。


AI与艺术的未来?


在现阶段,只要AI不被成为意识主体,那么AI的意义就仍在于作为工具将人从重复性脑力劳动中解放出来。在艺术创作过程中存在着的低创意要素艺术活动对于AI就具有很强的可替代性。但AI的介入并不会损害人类艺术家整体的主体地位,犹如艺术家借助助手创作并不会否定艺术家的成就,AI在此所做的始终是辅助工作,一部作品最有价值的部分依然有赖于人类艺术家完成。


AI技术的普及也可以让艺术家摆脱低级脑力活动而集中精力于作为核心的创意本身,从而拓展能力范围,提升创作效率。长期来看,AI介入艺术会加快艺术史的进化速度。每当进入一个新的艺术范式,AI就可以以已有作品为样本库而将相关的各种可能性迅速挖掘出来,从而加快艺术范式成熟,促使艺术家们更早开始新突破,打开新的维度。


同时应该看到,当AI快速模仿从古至今的艺术作品,生成出关于艺术也是现实的拟象。当人类的创造力受桎梏于人工智能时,当AI的训练素材已经穷竭,新的艺术范式如何诞生,也是无法回避的问题。


参考资料来源:

[1]Hornik, K., Stinchcombe, M., & White, H. (1989). Multilayer feedforward networks are universal approximators. Neural networks, 2(5), 359-3663

[2]Deep learning vs. Machine learning vs. Artificial Intelligence, https://www.javatpoint.com/deep-learning-vs-machine-learning-vs-artificial-intelligence.

[3]Boden, M. A. (2018). Creativity and artificial intelligence. Artificial Intelligence, 257, 1-15.

[4]澎湃新闻,以人工智能呈现的MoMA馆藏,除了梦境还有什么?https://k.sina.cn/article_5044281310_12ca99fde02001xnay.html?from=tech.


本文来自微信公众号:腾讯研究院 (ID:cyberlawrc),作者:李丰(四川美术学院)、童祁(腾讯研究院)