本文来自微信公众号:L先生说(ID:lxianshengmiao),作者:李睿秋Lachel,题图来自:《机械姬》
最近在网上看到绘画界对于AI绘画热烈的争论。主要的焦点在于:AI绘画的兴起会给行业带来什么样的冲击?会否导致大量画师的失业?
其实,在这几年AI高速发展的阶段里,类似的争论一直都存在。比如:AlphaGo会不会摧毁围棋行业?GPT-3会不会摧毁传媒行业?DeepL会否摧毁翻译行业?诸如此类。
但这一次,AI在绘画界引起的反响要更大一些。为什么?也许一个原因是因为:AI绘画的兴起,的的确确让人看到了颠覆行业的可能性。
今年6月份,我体验了一款叫做Disco Diffusion的AI,做出了一些作品。当时我的感觉是:非常出色,效果极好,但是对行业尚算不上颠覆。因为出图速度太慢(一幅图要渲染10分钟),并且在构图、布局上较为欠缺,也无法准确地画出人物。只能作为辅助工具。
没想到才过了两个月,这个观点就遭到了无情的回击。
8月份,我尝试了一款新的AI,叫做Stable Diffusion。它可以说把Disco Diffusion远远甩在了后面,不仅出图速度极快(几十秒),并且质量极高,在纹理、细节、光影等方面几乎可以以假乱真,甚至可以忠实地还原出实物的效果。
以下是我从网上找的一些别人用Stable Diffusion做的图:
可以看到,它出图的效果,连一般的画师可能都望尘莫及。
一
那么,绘画行业会被AI绘画颠覆吗?
实际上,将AI绘画应用于实践中已经有了不少案例。一类案例是游戏工作室。现在已经有不少游戏工作室,用脚本在后台自动运行AI,在极短的时间内自动生成成千上万幅头像、人物和图标,再精选出能用的进行细化修改和调整,极大地压缩了成本。
另一类案例是专业画师。有不少画师已经开始利用AI绘画辅助创作。比如,先画一幅草图,定好整体布局,然后用AI填充上丰富而饱满的细节,再在最终的成品上进行微调,节省大量描绘和填充的时间。
可以想见,等AI绘画更进一步地发展和流行起来之后,大量基础的执行工作会被替代掉。像“人物头像”这种创意含量不高、执行步骤较为繁琐的任务,用AI来操作就可以极大地提升性价比。
进一步,AI也可以成为画师们的利器。利用AI来辅助构图、找寻灵感、填充细节……可以极大地解放画师们的劳动,而把更主要的精力集中在沟通、创意和调整上。就像电脑绘画替代了大部分手绘一样,未来无法用AI来辅助创作的画师,也同样可能会被同行所替代。
从这个角度来讲,不管行业会否被颠覆或摧毁,新的改变已经无可阻挡地、浩浩荡荡地到来。
不过,现阶段的AI,依然还停留在“工具”的定位。它能发挥出什么样的效果,完全取决于使用它的人。毕竟,AI无法取代人去跟客户沟通,也无法完全理解自然语言,更不具备通常意义上的“自主性”和“创造力”。因此,对于诸多行业而言,它其实更多的是一种机会,而不是威胁。
比如:在AphaGo家族出现的时候,也有许多人惊呼“围棋是不是要被AI摧毁了”。但其实,围棋AI给围棋行业带来的是什么呢?是门槛的大幅度降低和普及化。
在过去,你要学围棋,得去培训班学习,由专门的老师指导,跟同学对弈、复盘,经历高强度的训练。但如今不需要了。现在每个人在家里,都能非常方便地找到可用的围棋AI,你可以调整难度跟AI对弈,也可以用AI来帮你复盘。在这种情况下,老师能起到的作用就很小了,只剩下偶尔的点拨和答疑了。
这对于传统围棋培训行业的商业模式当然是一种冲击,但门槛的降低,也会带来大量热爱围棋的入门者,让围棋行业变得更加繁荣。那么,能否通过转型适应大环境的改变,就是这个行业需要去做的事情了。
再比如翻译行业。这几年,AI翻译的发展如火如荼。以最新的几个翻译引擎来说,翻译质量已经超越了一般外语水平的使用者,几乎达到了母语的水准。但AI翻译能否直接使用、会否替代掉人工翻译呢?答案也是否定的。
原因很简单:绝大多数需要翻译的领域,对翻译质量都有极高的要求,不仅要求准确,还可能会有专业术语、语境、背景、遣词用字上的要求,而这是AI难以胜任的。在这种情况下,用AI先粗译一遍,再进行细致的润色,就是更有效的做法。
因此,在这个行业,用AI进行辅助翻译已经是行业惯例。不使用AI的译员,可能很难在这个行业立足 —— 因为效率差距实在太大了。从这个角度来讲,AI给翻译行业带来的,也不是摧毁,而是更高的质量和效率。
这些只是一些消费行业的例子。事实上,近十几年以来,在全球的各个领域,使用AI作为辅助工具,已经是一种行业发展的必然趋势,也是一种默认选择。
比如,在美国,贷款机构已经开始利用AI来决定是否放款。他们会利用一套复杂的算法,依据客户的消费、债务和其他数据,最终得出客户的“信用评分”,并根据信用评分判断是否批准贷款、批准多少额度的贷款。
在英国,已经有许多地方议会开始利用AI进行社会保障决策。据《卫报》2020年的一项调查,在英国的229家地方议会中,约有100家使用AI来辅助决策,包括决定是否通过福利申请和提供社会保障。
国外的许多公司也开始用AI来进行招聘。从简历筛选、职位匹配,到对面试者进行打分和心理评估,节省了大量的人力。
在心理、医疗和健康行业,AI也得到了大量的应用。比如,能够跟你对话并引导你进行心理干预的AI,能够结合患者的数据量身制定治疗方案的AI,能够辅助医生进行诊断和提供治疗建议的AI……尽管还未实现大规模普及,但已经有了不少卓有成效的尝试。
我们都知道能够伪造视频和音频的Deepfake技术,许多人都对其忧心忡忡,但加以规范利用和引导,它也可以发展出正向的应用。比如,目前有一个研究方向,是用AI模拟出逝去的亲人,跟我们进行对话。尽管目前只能实现简单的动态,但假以时日,像《黑镜》里面的景象,很可能成为现实。
更有名的可能是GPT-3。GPT是一款非常出色的文本AI引擎,2020年发布的GPT-3,拥有1750亿个参数,可以“创作”出足以以假乱真的各种文字,包括小说、新闻、报告、散文……
它的应用空间也极其广阔。比如:游戏公司可以用它生成真正随机的、完全不同的游戏对白;小说和剧本创作者可以用它来帮助寻找灵感;媒体可以用它来快速生成新闻报道;各类服务提供商可以基于它开发各种各样的聊天机器人;文学研究者可以用它来进行文本分析……诸如此类。
那么,它摧毁传媒行业了吗?其实也没有。相反,它的存在,使得传媒和创意行业的可能性被极大地拓展了,未来的发展空间无比广阔。许多过去难以实现的效果,都变成了可能。
总而言之,不管各行各业的人怎么看待AI,AI的到来已经是一种无可争辩的事实。与其捂上眼睛去诋毁它、漠视它、恐惧它,不如想办法去迎接它,并利用它去提高自己的效率,实现人力难以企及的突破。这可能是一种更好的心态。
未来并不遥远,很可能已经在我们身边。
二
不过,要注意的是,上面所说的AI,都停留在工具的层面,也就是“弱人工智能”。本质上来说,它们只是一段对信息进行加工处理的程序。我们喂给它们一堆数据,它们再根据规则吐出我们想要的结果,仅此而已。跟我们所理解的“人工智能”有着天壤之别。
如果我们把科幻片里的人工智能 —— 那种有意识、有人格、有自己的“思想”,能够“理解”自己在做什么的“强人工智能”,看作100%的形态的话,那么目前的AI,可能只是不到1%。
换句话说,如果强人工智能可以看作生命的话,那么目前我们实现的弱人工智能,最多可能只是一个氨基酸。
这也说明,目前的AI只是一个极其初级的形态,它的成长空间几乎是无限的。实际上,现阶段的AI翻译引擎,比起几年前的版本,质量好了不止一个档次;同样是扩散模型,Stable Diffusion比起年初的Disco Diffusion,也好了不止一个档次。
那么,弱人工智能跟强人工智能的分野究竟在哪里呢?我们有没有可能对AI进行不断的优化和提升,使之最终能够达到强人工智能的程度?如果能够实现的话,到时的世界会变成什么样子?
以下是我的理解和思考,不一定对,仅供参考。
我们知道:目前所有的AI,不管是什么领域、采用什么模型,它们的本质都可以大致归纳为三步:训练,预测,反馈。
首先,我们需要喂给AI大量的数据,告诉它“我们希望它学到什么”,让它从这些数据里面提炼出特定的模式。这就叫做训练,这些数据就叫做训练集。
从训练集中提取出模式和特征之后,AI就可以根据这些模式,基于不同的场景,去“预测”在这个场景下会出现什么、应该如何应对。这就是AI能够产生的结果。
最后,就是对AI所产生的结果提供反馈,告诉AI它做得好不好、对不对,从而让它不断进行自我修正、自我提升,最终能够产出更好的成果。
一个常见的例子就是生成对抗网络(GAN)。它包含一个生成网络和一个对抗网络。用绘画来打比方:生成网络的任务,就是我们给它一堆训练集,比如说某个画家的许多幅画作,让它努力地学习画家的风格,然后想办法创作出一幅以假乱真的画。
而对抗网络的任务,就是努力去挑生成网络的刺,把它创作的画从真画中区分出来。通过这样的“左右互搏”,AI就能够不断自我提升,最终达到真正以假乱真的效果。
但是,目前所有的AI都存在一个问题:它们所有的训练集来源,都来源于数码信息。换句话说,它们相当于“活”在数码空间里面,跟我们所处的现实物理空间是没有任何交集的。因此,它们永远没有办法真正“理解”所得到的数据,而只能按照自己从数码空间得到的规律去生硬地“套用”在信息上面,完成我们要求的任务。
一个经典的例子是“莫拉维克悖论”:尽管AI可以做到许多人脑无法实现的事情,比如在一秒内完成上千万次运算、处理上百万条数据、做出极其复杂的决策,但是一些对人类来讲极其简单的任务,比如用眼睛区分两个杯子,在一个房间里自由行走,或者理解一段对话的上下文,对它们来说却难如登天。
为什么会这样呢?因为,数码世界是没有办法自发地产生数据,构建出一个完整的、自洽的世界的,它的一切数据,都来源于现实世界的“投射”。也就是说,它只是现实世界的一个“降维”的投影而已。因此,“活”在低维度世界的AI,只能理解我们输入给它、为它制定的规则,是不可能真正理解高维度的世界的。
打个比方:就像一部小说里的角色,哪怕写得再生动、再鲜明,他也不可能真正活过来,理解小说之外的现实世界。同样,目前的AI,只能是一种工具,它不可能具备真正意义上的意识、人格和“生命”。
三
人工智能哲学界有一个经典的问题,叫做“框架问题”。丹尼尔·丹尼特是这样表述它的:
假设现在有一个洞穴,洞穴里有一块电池,洞穴外有一个机器人,快没电了,机器人必须拿到这块电池。但与此同时,电池绑着一颗炸弹,触动电池就会引发炸弹。
机器人1号:被下达指令“拿出电池”。但拿出电池的同时,它也被炸毁了。因为它不知道触动电池同时会引发炸弹。
机器人2号:下达指令“做一件事时,必须考虑它是否会导致其他事件的发生”。于是,机器人2号一直在思考:当我拿动电池时,墙壁会变色吗?天花板会塌下来吗?等等。最终没电了。
机器人3号:下达指令“只考虑跟任务相关的事,不考虑不相关的事”。于是,机器人3号一直在思考:哪些是跟任务相关的,哪些是不相关的?墙壁相关吗?天花板相关吗?于是也没电了。
简而言之:对于AI来说,让它知道“应该在一个什么样的框架内去考虑问题”是非常困难的 —— 尽管这对人类来说毫无难度。
那么,为什么AI存在框架问题,而人类就没有这个问题呢?
我们不妨想一想:我们是如何知道“当我拿动电池时,天花板不会塌下来”的?是因为我们看到了这条规则吗?不是的。是因为我们知道:天花板是一个稳定的结构。一般来说,如果没有外力对它进行作用,它是不会变化的。
那么,我们又是如何知道“天花板是一个稳定的结构”的?是有人教给我们这条规则吗?也不是。是因为我们在成长的过程中,我们看到过非常多次的天花板,我们从生活经验中学习到天花板的特性,知道它不会轻易地塌下来,于是我们的大脑自发地从这些经验中提炼出了这条规则。
许许多多这样的规则组合起来,就形成了我们对这个世界的认知,也形成了我们思考问题、考虑问题的“框架”。
但AI是没有这些“生活经验”的。它们的所有信息来源,只有现实世界投射到数码世界的信息。因此,对它们来说,所有的信息本质上都是一堆数字,它们无法把这对数字还原成规则和框架。
我们在生活中看见过无数次的人脸,那么不需要别人教我们,我们也会知道人的脸有五官、大致的比例是什么。但AI没有这些经验。对它来说,“人脸”也只是一堆数字而已,只不过这些数字经常一起出现,似乎存在某种特定的规律 —— 这就是AI眼中的世界。
再比如,看到“落霞与孤鹜齐飞,秋水共长天一色”,会让我们产生各种各样的想象,体验到审美的愉悦感;但在AI眼中,这14个字只是一堆数据,无法产生任何联想,因此并不存在任何“意义”和“美感”。
所以,要想让AI能够真正理解现实世界,也许只有两种方式。要么,是找到一种方法,可以更加有效地传达给它关于现实世界的种种规则和“隐性知识”,让AI具备跟人类相似的思维基础;要么,是让AI模仿人类的成长过程,直接从现实世界中学习规则,构造关于现实世界的各种表征。
后者现在也开始有研究人员在探索了。今年发表在《Nature》上的一篇研究讲到:他们基于发展心理学设计出了一款机器人,可以像人类婴儿一样学习简单的物理规律。这个机器人在学习后,当看到不符合物理规律的画面时,会呈现出“惊讶”的反应 —— 这或许是一条可行的道路。
那么,AI有没有可能发展出真正的强人工智能?如果到了那一天,这个世界会变成什么样子?
说实话,我也不知道。如果AI真的能够弥补这一空缺,真正像人类一样思考和学习(或者起码“看起来”像),那么,理论上来说,似乎没有什么是无法实现的。到时的世界,也许会变得完全不一样。
尽管从目前看,这一天似乎还要很久。
四
最后,聊一个有趣的问题:AI会有意识吗?如果我们真的面对着一台宣称它具备了意识的AI,我们如何判断它是否具备意识呢?
图灵测试吗?显然不行。图灵测试测的是智能,而非意识。
意识是什么?是能够体验和感知到自身存在的一种状态。一个有意识的个体,它能够体验到自身的存在,能够有主观的感受(我们称之为感质,qualia),而不是只是对输入信息做出固定的、程式化的响应。
哲学家 Susan Schneider 提出过一个很有意思的“人工智能意识测试”。她认为:如果一台机器具备意识,能够体验到自我的存在,那么它一定也能产生跟意识相关的其他想法和感受,比如:灵魂,轮回,自我,等等。
一个简单的类推:我们每个人一定都曾经有过类似的想法:我是谁?为什么我会是“我”,而不是其他任何人?藏在“我”身体里,构成我的种种想法、念头和主观感受的那个东西是什么,在哪里?诸如此类。
Susan Schneider 认为,这是有意识的生物所必然会经历的困惑和思考。一个对象有了意识,意识到自己的存在,必然会对这种存在感到好奇,进而去探寻和思考这种存在的本质。
因此,“人工智能意识测试”的步骤如下:
1)阻止人工智能去学习关于意识、心灵、存在等相关的哲学和科学知识。
2)跟它正常交流,聊聊意识、心灵、存在……看它能不能流畅地、自然地进行回答。
如果能,那可能意味着人工智能自发地产生了对这些话题的理解和体验。这种体验来自哪里呢?既然没有外在信息的输入,那只能是来自于它自身所产生的意识体验了。
当然,让AI产生意识的难度,可能比产生强人工智能的难度还高。
我无比期待这一天的到来,又无比担忧这一天的到来。
本文来自微信公众号:L先生说(ID:lxianshengmiao),作者:李睿秋Lachel