本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨,原文标题:《困惑、惊讶、微笑样样逼真,为什么这个“最有人味”的机器人令人害怕?》,头图来自:《我,机器人》
一声响指,机器人 Ameca 醒来了。她的脸上写满不知今夕何夕、此地何地的困惑,一旁的工作人员看了看她,又自顾自转过头去。
Ameca 试着伸展了手臂和手掌,发现活动自如,她惊讶地挑起了眉毛,但神情依旧茫然,说不上开心与否。
她转过头看见了你,她显然被吓了一大跳,下意识地张大了嘴巴。
犹豫了一番,她对你挤出了尴尬又不失友好的笑容,这是她醒来的第一个笑容。
Ameca,怎么这么“有人味”?
如你所见,Ameca 是一个逼真的类人机器人,它由 Engineered Arts 研发,这是一家总部位于英国的类人机器人设计和制造商,有 15 年以上的类人机器人开发经验。
为什么 Ameca 的表情这么“有人味”?根据官网介绍,Ameca 结合了 AI 与 AB(Artificial Body)技术,底层系统是机器人操作系统 Tritium 和工程艺术系统 Mesmer。
当然,Ameca 首先要配备广泛的传感器,包括摄像头、麦克风、位置编码器以及具有数千个参数的智能电子设备,以确保它是响应性和交互性的机器。
Tritium 可以直接在浏览器运行,适用几乎任何编码语言和多种软件,登录后即可快速处理各种数据,远程控制机器人面部、头颈、四肢等的各方面组件,使得机器人适应环境的突然变化并即时做出响应,保证人机交互的安全和乐趣。
如果机器人被要求同时做两件不同的事情,Tritium 会以安全的方式解决冲突并决定行动的优先级。
Mesmer 则通过对真人的 3D 内部扫描,准确地模仿人体骨骼结构、皮肤纹理和表情,这需要细分为几个步骤。
第一步,真人坐在几十台摄影测量装置的中间,Mesmer 从不同角度捕捉到多张重叠的数码照片,再比较像素颜色和定义锚点,以数字方式将其重建为 3D 模型。
第二步,将原始 3D 模型带入建模软件,经过“去除头发”等细节处理,建立一个干净的 3D 模型。
第三步,在立体光刻 3D 打印机上生产精确模具,并将硅胶注入模具中,为机器人打造类人皮肤,头发和精细的细节涂料则需要手工添加到硅胶皮肤上。
图片来自:Engineered Arts
最后,将硅胶皮肤放置在机器人头部以完成组装,再使用 Engineered Arts 的云软件 Virtual Robot 添加运动序列和声音。
Engineered Arts 对 Ameca 的定位是:
Ameca 是用于人机交互的完美人形机器人平台,我们专注于为您带来创新技术,这些技术可靠、模块化、可升级且易于开发。
也就是说,Ameca 是一个采用“模块化设计”的机器人,未来将在硬件和软件各方面进行升级,目前还只是一个起点,带有强烈的试验色彩。
虽然 Ameca 有逼真的面庞,但它还不能步行、跳跃或跑酷。Engineered Arts 计划“随着时间的推移升级其能力,以便有一天它会走路”。
Ameca 将于明年 1 月的 CES 2022 上登台亮相。据路透社,Ameca 现在可供购买或出租,购买价格超过 13.3 万美元。
很有意思的是,Ameca 的皮肤呈灰色,似乎刻意带有理性、中立的特征。Engineered Arts 运营总监 Morgan 表示:
Ameca 代表了一个完美的平台,探索我们的机器如何在未来的可持续社区中与我们共存、协作并丰富我们的生活。Ameca 将 AI 与 AB 集成在一起,提供先进的迭代技术、卓越的动作和手势,所有这些技术都以人类形式和机器人面貌呈现,以无威胁、性别中立的方式融入包容性社会。
类人,但远远不是人
像 Ameca 这样的类人机器人,究竟是用来做什么的呢?
从官网问答页面来看,Engineered Arts 专注于创造用于娱乐的人形机器人,Ameca 可能会成为场地和活动的关注中心,而不是在各方面接替人类:
我们的创新机器人擅长向观众表演,在各种活动中俘获人心。对于希望吸引人群的科学中心、主题公园和企业,我们的机器人将为游客、代表和观众带来永生难忘的体验。
观众可以在现场通过触摸屏直接控制机器人,移动机器人的头部和眼睛,改变其 LED 和动画图形,选择一些预先配置的姿势、动作和问候;企业也可以提前租用,Engineered Arts 将为机器人制作 5 分钟的内容,用于宣传新产品或品牌。
除了像 Ameca 这样的机器人,Engineered Arts 还有客户服务机器人 Quinn、演讲机器人 RoboThespian,你甚至可以定制自己的交互机器人,不管它是什么模样,从前的例子有巨大的怪兽 Kong 、《捉妖记》的井柏然和胡巴。
后者陈列在杜莎夫人蜡像馆之中,他们能够检测人们的面部表情,并改变屏幕上的图像与之匹配。如果有人在机器人面前皱着眉头,屏幕上将出现雷电,胡巴会模仿他们愤怒的表情。
但这些机器人带来的,都是逼真的人机社交互动。何为“逼真”?意思就是“还不完全是”。
举例来说,Engineered Arts 的机器人可以直接处理在酒店办理入住手续的日常流程,而当涉及到“无麸质早餐”等复杂情况,提问者将通过名为 TinMan 的远程呈现软件与机器背后的人联系,虽然看起来依然是与机器人本身在对话。
在这个过程中,人工智能也将通过机器学习不断改进。问的问题越多,它从真人那里学到的东西就越多,但真人依旧不可缺席。所以,不必担心机器人已经有自我意识。
Engineered Arts 机器人的局限性还存在于很多地方。
通过自动语音识别,它可以“听到”,并将声音转换为文本字符串,但无法识别说话语气或关联上下文。
通过安装在类人眼中的摄像头,它可以“看到”,并使用计算机视觉和名为 Visage 的软件,定位图片中的人脸并猜测年龄、性别和面部表情,但是它还无法识别个人。
所以,当被问及 Ameca 是否是 AI 时,Engineered Arts 指出,虽然它包含一些可以被描述为“AI”的软件,但机器人和 AI 之间还是有区别的,纯 AI——在《她》《银翼杀手》和《2001 太空漫游》等电影中描绘的那种——尚不存在。
他们将自己的机器人比作电动汽车:
人工智能(artificial intelligence)与人类智能(human intelligence)的这种结合是混合智能。想想电动汽车,在有可能拥有全电动汽车之前,半电动半汽油出现在 1990 年代。类似的事情最终会发生在 AI 身上。
图片来自:Engineered Arts
当我们看到 Ameca 这个栩栩如生的机器人时,我们可以优哉游哉观赏,同时将恐惧和机器人三定律安全地藏在脑海里,再多等上一段时间。至少,它远不能取代人,它在现阶段也没有这样的目的。
朋友,你陷入恐怖谷了吗?
Ameca 的出现,也引起了对“恐怖谷效应”的关注。恐怖谷是一个关于人类对机器人和非人类物体的感觉的假设:
由于机器人与人类在外表、动作上相似,所以人类会对机器人产生正面情感;到达特定程度时,机器人与人类间的细微差别会显得非常刺眼恐怖,人类的反应突然变得极为负面;当相似度继续上升,人类的情感反应再度回到正面,产生人类与人类之间的移情作用。
但这个“谷”究竟出现在什么时候,没有明确的界定。当你看到 Ameca 的时候,你觉得它过了恐怖谷的节点了吗?它是否已经足够让你移情了?
关于恐怖谷效应的成因,主要有两大类解释。第一类认为,恐怖谷效应是人类在漫长生存中逐渐产生的生理防御机制,类似我们看到尸体和重病病人时对恶疾、病菌、死亡的联想;第二类认为,恐怖谷效应来源于人类的认知焦虑,因为类人机器人不能轻易地算人,也不能轻易地算机器。
无论是什么角度,其核心都是对当下的“人”的境况的关注。我们沉浸在一种焦虑中,希望将自己与他人、社会、物品相区分开来。《仿生人会梦见电子羊吗?》里,界定仿生人的一项标准是“移情测试”,不管它事实上科学与否,其实就是在寻找一个具有确定性的界限。
与此同时,我们热衷于将机器人打造成人的模样。尽管 Engineered Arts 表示类人机器人尚不能取代人,但他们同样认为,它有“在各种活动中俘获人心”的作用。但类人机器人究竟有什么好看的?为什么不能做一只哆啦A梦或者瓦力呢?
如果是为了提高工作效率,造出类人机器人似乎很划不来,还不如造出各种专门用途的机械或电子设备供人类使用,比如有长臂、多足和水陆空多栖的机器人。
目前这个外貌最像人的机器人,它的作用也只是聊以自娱,还没有到威尔·史密斯的《我,机器人》中的恐怖境地——智能机器人在反乌托邦世界中填补了公共服务职位。这往往是我们对机器人最担心的地方之一。
今年 6 月,日本大阪大学教授石黑浩成立了初创企业 AVITA,致力于“分身机器人远程工作”的研究,以此解决劳动力不足问题。概念是,分身操控员安坐家中,电脑上的麦克风和摄像头读取操控员的表情和动作,并反映在分身上,分身在屏幕上和餐饮店顾客沟通。
石黑浩称:“计划把人类从肉身中解放出来,创造一个任何人都能随时随地自由工作的社会。”在他看来,人类在面对机器人时会感到安心,不会产生精神上的疲惫感,原因是不需要察言观色。
与 Ameca 突出类人特质相反,石黑浩看重的其实是“类人机器人”非人的部分——不需要像对待人一样对待机器人。
但两者亦是殊途同归。在许多科幻电影和小说的探索思考之外,我们看到许多类人机器人在现实生活的用处,依然是一种因逼真模仿而产生的娱乐效果,以及对重复性、情绪性工作的代替作用。它们尚不是我们中的一员,我们通过它们,确认自身的特别所在。
本文来自微信公众号:爱范儿(ID:ifanr),作者:张成晨