用DNA生成的照片抓犯人,靠谱吗?代价又是什么?

随着技术的进步,犯罪的成本也越来越高。

想当年吴用智取生辰纲的时候,抢完就跑,根本不用担心指纹问题,而现在连一根头发都不能留在案发现场,光靠DNA就能抓到犯罪分子。



最近位于加拿大的埃德蒙顿警察局(EPS)公布了一张2019年性侵案嫌疑人的合成照片,由Parabon NanoLabs公司使用DNA表型(phenotyping)分析技术对掌握的DNA证据进行面部合成。

合成图像为一张年轻黑人男子的照片,合成过程没有考虑嫌疑人的年龄、体重指数或环境因素,比如面部毛发、纹身和伤疤等。



EPS随后在其官方网站和包括Twitter在内的社交媒体平台上向公众发布了这张照片,并声称这是「在所有调查方法都用尽之后迫不得已的最后手段」



虽然警方此举是为了抓捕犯人,但公众却不买账,认为这种行为已经严重侵犯隐私,甚至有可能加剧种族歧视。

抓犯人也不能乱用DNA

据隐私专家称,EPS制作和分享这张照片的决定对社会造成了非常坏的影响,引发了人们对法医调查中DNA表型分析的种族偏见以及调查人员能够搜索到的DNA数据库的隐私侵犯的疑问。

在回应EPS的图片推文时,许多隐私和刑事司法专家对警察部门的不负责任表示愤慨。

电子隐私信息中心(Electronic Privacy Information Center)的全球隐私顾问Callie Schroeder转发了推文,并对这种照片是否有意义发出了质疑:即使这是一条新的线索,你们打算怎么处理它?审讯每一个大约5英尺4英寸(1.62米)高的黑人?这不是建议,绝对不要这么做。



广泛传播这种基本上是计算机生成的猜测可能导致所有身高为1.62米的黑人受到大规模监视,监视者有可能是他们所在的社区和执法部门。

Schroeder表示,嫌疑人范围过于广泛,不足以成为增加监控或怀疑的理由,而这些监控或怀疑可能适用于成千上万无辜的人。

但案件的受害者对嫌疑人只有有限的描述,除了身高5英尺4英寸外,还有戴着黑色帽子,穿着裤子和毛衣,或者穿着连帽衫,有口音,这些很难对嫌疑人进行一个清晰、易区分的画像。



电子前哨基金会监控诉讼主任Jennifer Lynch表示,像埃德蒙顿警方最近所做的那样,向公众发布一张Parabon公司合成的照片是危险且不负责任的,尤其是当这张照片涉及黑人和移民时。

有色人种已经过高比例地成为刑事调查的目标,不仅会加剧这个种族歧视问题,还可能导致公众的警戒和对被误认的个体造成真正伤害。

刑事司法和警务系统充满了种族偏见。

黑人被警察无故制止的可能性是白人的五倍,即使没有犯罪发生的情况下,黑人、拉丁裔和有色人种也有更高的概率被制止、搜查和怀疑犯罪。

看到没有背景或DNA表型知识的合成图像,可能会误导人们相信嫌疑人和照片中看起来完全一样。

Schroeder表示,许多公众看到这张照片时,不会意识到这只是一张近似的照片,年龄、体重、发型和脸型可能非常不同,皮肤、头发、眼睛颜色的精确度都是近似值。

埃德蒙顿警察局后续又发布了一份新闻稿,宣布从其网站和社交媒体上删除了这张合成图片,以回应照片发布和DNA表型分析技术使用后的批评。



EPS的首席运营官Enyinnah Okere表示,他对这件事感到非常紧张,他把调查放在了优先位置。在这起案件中,受害者本人是一个种族社区的成员,当时只考虑到为受害者伸张正义,而没有想到对黑人社区的潜在伤害。这不是一个可以接受的交易,我为此表示道歉。

Parabon NanoLabs还向媒体发送了一些案例研究,其中DNA表型分析帮助解决了谋杀和袭击案件。

但这些案例研究并没有解决更受关注的社会问题,这些问题更难衡量,比如在最终嫌疑人被捕之前,有多少无辜的人接受了询问,以及嫌疑人的形象可能对公众的种族偏见产生了怎样的影响。

Parabon方面表示,该公司参与了数百起执法调查。在它的网站上有许多案例研究,其中许多显示了 DNA 图谱和嫌疑人的实际照片之间的比较。两张照片中有一些相似之处,反映了相同的种族、性别、眼睛和发色。



但生成的照片与嫌疑人之间的相似性通常也仅限于此。

Parabon NanoLabs生物信息学主任兼Snapshot部门技术主管 Ellen Greytak博士表示,我们只是根据DNA做出预测,只有这么多信息,所以当模型做出预测的时候,就是一个面部描述而已。

如果警方有证人的话,那么他们就不需要我们了。我们提供的是事实,就像基因证人(genetic witness)一样,可以提供警官们无法得到的信息。

这就好像警察从一个人那里得到了一些描述,也许你知道,这个人没有近距离看到他们是否有纹身或疤痕,但他却能够描述这个人的外貌特征。

通过验证可以发现这种方法非常有用,特别是在缩小搜索范围和排除那些与预测不符的人方面。

在掌握了嫌疑人DNA的情况下,警察不必担心会抓错人。

据Greytak说,这项技术通过机器学习模型对输入的嫌疑人DNA来创建合成图像,机器学习模型的训练过程需要成千上万人的DNA及其外观。

实验室收集的有关已知外貌的人的数据来自各种各样的渠道,其中一些是公开的,可以申请访问,比如开源免费的家谱网站GEDmatch和FamiltyTree DNA;还有一些来自曾经进行的研究搜集的信息。

用户应该知道,如果他们将自己的 DNA 发送给面向消费者的公司,他们的基因信息可能会落入执法部门手中,用于对他们或他们的基因亲属进行刑事调查。所有这些数据都不在美国联邦健康隐私条例的保护范围之内。

虽然公司通常要求获得授权,并限制向执法部门披露用户数据,但其它消费者遗传系谱学公司,如 GEdmatch 和 FamilyTree DNA,则提供了对其数据库的近乎全量的执法访问。

Parabon NanoLabs声称,他们生成的图像不是基于种族,而是基于遗传祖先。

然而,研究人员认为,考虑到家族起源,DNA分析并不是一个客观的测量,因为它可能会把特定人群视为比其他人更容易犯罪。

DNA到底靠不靠谱

由人类学家Amade M’charek领导的研究人员在一项名为「种族法医鉴定的麻烦」的研究中写道,虽然传统的 DNA 分析方法主要针对的是个别嫌疑人,但最近人们对法医鉴定的兴趣发生了转变,一个未知嫌疑人所属的人群和家庭已经成为了焦点。对这个未知嫌疑人的表型或家庭关系进行推断,就会产生嫌疑人口和家庭。



论文链接:https://journals.sagepub.com/doi/epub/10.1177/0162243919899467

2019年Buzzfeed的一项调查显示,GEDmatch允许警方上传DNA档案来调查一起严重伤害事件,之后该网站改变了政策,用户必须选择进行执法搜索。

尽管如此,调查人员还是能够利用一些类似的数据库上传嫌疑人的 DNA,绘制出嫌疑人的家谱,直到他们能够确定嫌疑人的真实身份。



有一个臭名昭著的案件证明这种策略是成功的,在寻找金州杀手时,一个连环杀手命名为Joseph James DeAngelo,在把他的 DNA 上传到GEDmatch 之后,调查人员找到了他的一个已经在系统中的家庭成员,并在DeAngelo犯罪几十年后追踪到了他。



许多警察部门一直在收集无辜者和轻微犯罪者的DNA,比如奥兰治县(Orange County) ,该县拥有超过18.2万份 DNA 档案的数据库,几乎所有人都受到了轻罪指控,包括小偷小摸或驾照被吊销。

几名律师对该县提起诉讼,声称该数据库违反了加州法律。诉讼称,交出DNA 是一种「强制性交易」,因为交出 DNA 样本的人将受到较轻的惩罚,甚至可以撤销案件。



法律援助协会(Legal Aid Society)也在纽约市提起了类似的诉讼,指控纽约市运营一个DNA数据库,违反了州法律和宪法对不合理搜查的保护。

这些 DNA 数据库再次延续了刑事司法系统中普遍存在的种族偏见。由于有色人种,尤其是黑人和拉丁美洲人,占过去十年纽约市被捕人数的75% ,DNA 数据库进一步将犯罪行为列入边缘化人口统计。



虽然种族不一定通过DNA表型来衡量,但是种族是由 DNA 复合图谱的视觉特性和已经存在偏见的DNA数据集,即训练集的收集过程已经注入了偏见。

DNA表型分析的使用可能破解了一些悬案,但我们不得不问: 代价是什么?

参考资料:

https://journals.sagepub.com/doi/epub/10.1177/0162243919899467