本文来自微信公众号:果壳 (ID:Guokr42),作者:Lilyann,题图来自:《银翼杀手2049》


前段时间,人类艺术家们在 Instagram 上发起 #artbyhumans 运动,抵制 AI 作画,“影响艺术家收入”、“AI 在艺术作品里抓取再拼贴”……不知当他们看完 AI 画出来的手后,会不会稍微松口气?


AI 画“手”|Medium<br>
AI 画“手”|Medium


因为想象力和创造力,AI 被吹捧上天,但不可忽视的是,它们画出来的手如此笨拙、怪异,像惊悚电影里的道具。


网上流传着这样的梗图,调侃 AI 的绘画功底:



“怎么辨别这是 AI 画的?看手就行了。”|Twitter<br>
“怎么辨别这是 AI 画的?看手就行了。”|Twitter


那么,为什么 AI 画不好手?


有一说一,手是真的很难画啊!  


别说 AI,人类自己都不一定能把手画明白。


荷兰艺术家埃舍尔(M.C. Escher)在 1948 年创作过一幅石版画,名字就叫 Drawing Hands(画手)。画面中,两只手通过画笔彼此相连,“一只手创造了另一只,而另一只又创造了第一只”,这种矛盾恰恰表达出了:人们想要描绘出两只动态的手有多难。


Drawing Hands|Wikipedia<br>
Drawing Hands|Wikipedia


如果再搜一搜,你会发现“画不好手”是一个困扰全球画师的难题。插画家 Anna Daviscourt 写道:“画手是最有表现力,最复杂,解剖学程度精细的工程。”


还有人把问题抛给了 AI 的“自家人”——ChatGPT。


ChatGPT 答道:“手是由许多小骨头、肌肉和肌腱组成的,所有这些都必须被准确描绘出来才行。此外,手的位置也很难表达,因为它们不断在运动状态中。因为这些困难,许多艺术家发现,手部绘画是他们技艺中最令人沮丧和最具挑战性的方面之一。”


ChatGPT 的解答<br>
ChatGPT 的解答


手的复杂性不仅仅在于它本身就有很多个关节、折痕等微小却关键的细节,还在于手每动一下,原有的关节都会变得不同。


有人还真数过,从手指的长宽度,到掌骨与腕关节,一只手大概就有 30 个几何变化点,这还不包括手掌的阴影与褶皱的变化。


图源:GIPHY<br>
图源:GIPHY


如果你仔细观察的话,会发现大多数卡通人物的手都只有 4 个指头(三个手指和一个大拇指),因为在动画流程制作繁复的早期,少画一根手指省时省力,还省钱!迪士尼曾透露过,少画 1 根手指为公司节省过上百万美金。


比起面部,手并没有那么多可供 AI 学习的样本  


AI 在“创造”艺术时并没有逻辑思维,它并不知道这里或者那里“应该”有什么,只能先接收人类的指令,再与系统内的训练库进行比照,用生成的图像尽可能回答“what is this”(这是什么),而非“why is this”(为什么是这个)


所以,你要想生成更加精准的图像,比如一头栩栩如生的小猪,就要给 AI 足够具体的指令。


指定提示词前后,AI 画出的小猪对比|itpedia<br>
指定提示词前后,AI 画出的小猪对比|itpedia


但这还远远不够,人们要想 AI 画得精准,还要提供足够丰富的真实图像标注,让 AI 学习。


手这个复杂几何形状,意味着没有通用的线条或形状集合,可供 AI 识别手。所以,AI 必须结合许多不同的形状、组合来画出令人信服的手。


而为什么 AI 总是把手画残,恰恰是因为没有充足的参照物。


知乎上有网友这样解答:“一张图片上,手往往占的面积很小,经常被遮挡和半遮挡,导致手部所占像素较少细节不够。而且,手部的标注是要准确标注手掌、拇指、食指、中指、无名指和小拇指才可以,这部分的工作算法很难自动化,需要人类来完成,这就大大增加了成本。”


一只手,应该被正确标注出的部分(右上)|知乎<br>
一只手,应该被正确标注出的部分(右上)|知乎


这可不是极个别情况,如果把人类的脸变成像手一样复杂的动态结构,AI 也同样画不明白。


在我们的脸上,唯一能活动的关节是颞颌关节,在一些二次元作品中,还常常弱化这个关节的存在。但如果我们的面部变得足够“灵活”,比如,鼻子可伸缩,舌头能打结,那 AI 肯定也会犯难。 


还有一个让“AI 画不好手”传播开来的原因,那就是:手一旦画错,真的是很明显啊!


如果 AI 创造了一个比例不太对的肩膀,我们一般不会注意到画面中这个人的肩膀窄了百分之五。但如果他们的拇指、食指、中指、无名指和小指都比平均水平小一点,那就容易显得奇怪了。


这是受到人的固有感知影响。心理学有一个理论叫做“撒切尔效应”,1980 年由约克大学心理学教授彼得·汤普提出,当时他以撒切尔夫人的画像作例。


撒切尔效应|Wikipedia<br>
撒切尔效应|Wikipedia


我们第一眼能看出什么?右图的眼睛与嘴巴被上下颠倒了。你需要更仔细才能看出,左图的五官实际上也是错位的。


也就是说,错位发生在正立的脸上很容易露馅,但发生在倒立的脸上就能骗过人。因为我们平日里很难见到倒立的脸,难以形成固有认知,所以在你把屏幕旋转过来之前,很难看出不同。


而我们对手部太熟悉了,感知格外敏感。


AI 创作的“手”|Gagadget<br>
AI 创作的“手”|Gagadget


教会 AI 画手,有啥方法吗?  


不得不说,人类在提升 AI 画技方面,也是“卷”得孜孜不倦。


今年初,一个叫“ControlNet”的新 AI 插件在 GitHub 上爆火,如今已收获超过 10k 星。


简单来说,这个插件通过给 Stable Diffusion 这样的 AI 作画模型增加一个额外输入,来优化生成的细节,相当于给 AI 创作加了一层 buff。


效果的确比之前过于抽象的手部创作靠谱了些,但如果仔细看的话,你还是会发现……咦,怎么一共有 6 个手指?


点开放大,数数一共几个手指|Github<br>
点开放大,数数一共几个手指|Github


也有一些比较取巧的方法。比如,有人传授经验:要想让 AI 画出一只正常的手,你只需要告诉它“mittens”(手套)这一个词,往往在有手套的图片中,五个手指根根分明,且没有什么特殊的手势。


一双手套|Gagadget<br>
一双手套|Gagadget


或者告诉它“结婚戒指”、“指甲油”这两个词。AI 往往就能搜索到很多高清的手部照片,降低画残概率。


戒指或指甲油|Gagadget<br>
戒指或指甲油|Gagadget


说到底,这些都属于一些帮助 AI 偷懒的小技巧,要论画手的真实力,AI 还是咱们人类,都得好好学习啊!


参考文献

[1] https://www.thepaper.cn/newsDetail_forward_21992745

[2] https://www.pingwest.com/a/191335#:~:text=%E5%85%B3%E4%BA%8E%E8%BF%99%E4%B8%80%E7%82%B9%EF%BC%8C%E8%91%97%E5%90%8D%E7%9A%84,%E4%BA%BA%E4%BB%AC%E7%9C%8B%E5%BE%97%E6%9B%B4%E6%B8%85%E6%A5%9A%E3%80%82

[3] https://www.sciencefocus.com/future-technology/why-ai-generated-hands-are-the-stuff-of-nightmares-explained-by-a-scientist/

[4] https://bootcamp.uxdesign.cc/how-to-draw-hands-with-an-ai-image-generator-776ce3a814fe


本文来自微信公众号:果壳 (ID:Guokr42),作者:Lilyann