机器学习在提供各项新工具的同时,也可以帮助考古学家更好的了解过去,尤其是在破译古代文字方面。Alphabet 子公司 DeepMind 近日创建了一项新的人工智能模型,它不仅可以帮助恢复古希腊铭文中缺失的文字,还可以为文字的写作时间(30年内)和可能的地理来源提供建议。
在一次新闻发布会上,帮助创建该模型的历史学家和机器学习专家 Thea Sommerschield 表示:“碑文真的很重要,因为它们是直接的证据来源......由古代人自己直接写的。人类真的很难驾驭所有现有的相关数据”。
由于年代久远,这些文本往往被损坏,使修复工作成为一项有意义的挑战。而且,由于它们经常被刻在石头或金属等无机材料上,这意味着像放射性碳测年这样的方法不能用来找出它们的写作时间。Sommerschield 说:“为了解决这些困难,外文学家在类似的铭文中寻找文本和背景的相似之处。然而,人类真的很难驾驭所有现有的相关数据并发现潜在的模式”。
这款名为 Ithaca 的新软件是在约 78,608 个古希腊铭文的数据集上训练出来的,每个铭文都标有元数据,描述了它的写作地点和时间(根据历史学家的知识)。像所有的机器学习系统一样,Ithaca在这些信息中寻找模式,将这些信息编码在复杂的数学模型中,并使用这些推断来建议文本、日期和起源。
在《自然》杂志上发表的一篇描述 Ithaca 的论文中,创建该模型的科学家说,在修复受损文本中的字母时,它的准确率达到62%。它能以71%的准确率将碑文的地理起源归于古代世界的84个地区之一,并能将文本的日期确定在其已知写作年份的平均30年内。
例如,DeepMind强调的测试显示,该模型有助于将历史学家恢复古代碑文中缺失文字的准确性从25%提高到72%。但迪克指出,那些被测试的人是学生,而不是专业的书画师。她说,人工智能模型可能会被广泛使用,但这并不意味着它们可以或应该取代破译文本的一小批专业学者。