距离我个人最近的在线数据消失恐怕是虾米的下架了,上万首收藏的歌曲瞬间归零。这也让我想到多年前使用的MSN退出中国后,写了几年的博客日志也就随即蒸发了。如今各种在线存储服务频出,用户如何能够长久保存各种资料和数据成为了一个重要的问题,但实际上,开发商并不就一个关乎永久的问题给出永久的答案。


本文来自微信公众号:利维坦(ID:liweitan2014),作者:Chris Baraniuk,头图来自:《我是谁:没有绝对安全的系统》剧照


如果你的数字数据——电子邮件、短信、照片和文档——很快就会在一系列毁灭性的电风暴中消失,你会如何竭力保住它们?


这就是苏珊·多诺万(Susan Donovan)所设想的未来的灾难,她是一名高中教师,也是一名科幻作家,常驻纽约。在她自行出版的小说《纽约市地理学》(New York Hypogeographies)中,她描述了这样一个未来:2250年,由于电力干扰,海量数据遭到删除。在随后的几年里,考古学家们在被毁坏的城市公寓中遍寻21世纪初的文物。


她说:“我在想,‘如果所有的数码产品都不见了,这会给人们带来怎样的变化?’”


在她的故事中,灾难性的数据丢失并不是世界末日,但极具破坏性。它促使人们改变保存重要数据的方式。多诺万写道,电风暴带来了印刷业的复兴。但人们也得思考如何储存那些无法打印的东西,比如增强现实游戏。


数据从来都不是完全安全的。试想一下被烧毁的亚历山大图书馆——毁于一场大火可能是你听说过它的唯一原因。数字数据不会在巨大的火灾中消失,却会消失于一次单击,或随着时间推移,消失于存储介质无声的悄然退化中。


今天,我们已经习惯了这种删除。这样的例子不胜枚举——2019年MySpace个人资料消失便是轰动一时的例子之一。多年来许多陆续关闭的谷歌服务也囊括其中。此外,还有一些在线数据存储公司,为人们的数据提供安全保障。但讽刺的是,他们有时会指定删除某些数据。


© Yoors<br>
© Yoors


在其他情况下,这些服务会长时间运行。但用户可能会丢失登录所需的详细信息。或甚至忘记了他们有过账号。他们可能再也无法像在阁楼里找到一鞋盒的旧信件那样,找到存储在那里的数据了。


多诺万之所以对“转瞬即逝的”数字数据感兴趣,原因在于她的个人经历。她在大学专修数学,有多份手写笔记。她笑着说:“有一次我开始记电子笔记,之后却找不到了。”


上世纪90年代末,她还写过在线日记。现在日记没了。她从事的创意项目也不再完好地保存在网络上。当她创造这些数据时,还以为自己在创造可以长久存在的东西。就像可以无限重放的电影那样。但现在,她对什么是数字数据及其可能持续多久的理解已经改变了。


她说:“这更像是我写了一出戏,你看了,但你得到的只有回忆。”


由于我们祖先刻在建筑物墙壁上的石碑、古书和启示经久不衰,我们的文化中存在着一种偏见,即认为文字是历久弥坚的。我们经常引用几个世纪前的评论,因为有人把它们写下来了,并保存着完好的副本。但在数码形态下,文字只不过是屏幕上光的投射。只要灯一灭,可能就消失不见了。


但是,也有一些在线数据能存在很长时间。有几个网站至少维持了30年。数据会继续存在,即使我们并不想这样。“被遗忘的权利”这样的说法由此诞生。正如科技作家、BBC网络产品经理西蒙·皮特(Simon Pitt)在科技出版物《零一》(OneZero)中所说,“现实是,你想要的东西会消失,而你不想要的则会永远存在。”


杰森·斯科特(Jason Scott)想要调整这种平衡。他管理着档案小组,这个小组致力于保存数据,特别是那些被关闭的网站的数据。


他主持了数十项活动,及时捕捉和存储了信息。但想保存一切往往是不可能的。当MySpace意外删除了约5000万首歌曲时,一个匿名学术团体给了档案小组他们之前备份的近50万首歌曲的合集。


“对有些乐队来说,MySpace是他们存在的唯一证明,”斯科特说,“整个文化图书馆都被毁了。”MySpace为当时的数据丢失事件道歉。


斯科特说:“一旦你删除了这些内容,它就完全消失了,”他解释了主动保护数据的重要性。他还认为,在某种程度上,社会已经无意识地进入这种境况:“我们没想到网络世界会变得如此重要。”


现在应该清楚的是,数字数据是不稳定的。但如何抑制它容易消失的特性呢?


斯科特说,他认为应该对相关公司有法律或监管要求,要允许人们在在线服务关闭后的一段时间内(比如5年)仍可恢复自己的数据。在那段时间内,任何想要自己信息的人都可以进行下载,或者至少自费购买一张CD拷贝,让相关公司寄给他们。


他补充说,少数公司树立了良好的榜样。斯科特提到了Glitch,这是一款二维多人在线游戏,2012年,自其推出一年多后,就从网上移除了。斯科特说,从数据的角度来看,它的清算过程“基本上是完美的”,其他人也赞扬了这样的做法:该游戏的开发者充分理解玩家的失望情绪,并给了他们足够的机会在关闭之前从公司的服务器下载数据。


一些游戏的代码甚至被公开了,粉丝们开发的多个Glitch翻版在此后的几年里出现了。


不过,应该强制相关公司效仿这种做法吗?


MyData(译者注:一家国际非盈利组织,致力于建立一个公平、可持续和繁荣的数字社会)的泰穆罗普南(Teemu Ropponen)认为:“我们应该拥有实时权限,比如可以要求删除、下载或迁移数据——将数据从一个源传输到另一个源。”


他和同事们正在开发一种系统,旨在让人们更容易地在不同服务项目或机构之间转存有关自己的重要数据,如家庭史或简历。


罗普南认为,欧盟内部有将这种数据迁移写入法律的尝试。但还有很长的路要走。


即使技术和法规已经到位,但这并不意味着保存数据这件事就会一夜之间变得容易。我们的数据太多了,实在难以捉摸。


大约150年前,给家庭成员拍照是一种奢侈,只有社会中最富有的人才能享受。几十年来或多或少都是如此。即使技术越来越普及,一次性拍很多照片也不便宜。照片因此成为珍贵的东西。如今,智能手机的拍照功能意味着人们每年可以拍摄成百上千张照片,拍照彷佛是第二天性。


“我的孩子们或孙子们会怎么处理我手机里的400张宠物照片?”内布拉斯加大学林肯分校(the University of Nebraska-Lincoln)的保罗·罗伊斯特说,“这对他们意味着什么?”


罗伊斯特认为,保存我们所有的数据不一定对我们的后代有多大用处。他不同意斯科特和罗普南的“法律才是答案”的说法。他说,政府和立法者往往在技术相关的问题上落后,有时并不了解他们意图监管的体系。


相反,人们应该养成选择和保存重要数据的习惯。他说,“我们应该专门空出一年中的某一天——作为数据保护日,来梳理自己的数据。”


斯科特还建议我们应该思考自己真正想要保留的东西有哪些,以防它们被删除。


“没有人认为这些数据是必须不惜一切代价要保存的东西,它只是数据而已,”他说,“如果这些数据是书面的,我会打印出来。”


不过,还有另一种选择。芬兰东南应用科学大学(South-Eastern Finland University of Applied Sciences)的米娅科索宁(Miia Kosonen)和同事一直致力于解决档案馆和国家机构的数字数据存储问题。


她说:“我们转码了芬兰最大报纸赫尔辛基日报(Helsingin Sanomat)前主编的20多万封旧邮件。” 这说的是一个Digitalia(译者注:一个西班牙语数据库)主持下的数字数据保存试点项目。转码后的电子邮件后来被储存在一个数字档案中。


众所周知,美国国会图书馆(US Library of Congress)有一个推特数字档案,不过它已经停止记录每一条公开的推文,开始“有选择性地”保存它们。


公共机构能代表我们做一些数字数据的整理和保存工作吗?如果可以的话,我们就有可能向他们提交家族史和照片等信息,以便保存和将来进行查阅。


科索宁说,此类项目自然需要资金,这些钱可能来自公众。公共机构也更倾向于保留那些有重大文化或历史意义的信息。


这场讨论的核心很简单:我们很难知道——当下的我们或我们的后代在未来真正重视的是什么。


档案或监管干预可以在某种程度上解决数据保存的短暂性。但在某种程度上,我们可能永远都需要与这种短暂性共处。数字数据对于日常生活来说实在太方便了,我们几乎没有理由去尝试存储所有的东西。


保不保存完全看个人动机。现在,我们决定,要么尽力去保存或者不保存这些数据。是真正意义上的保存。不仅仅是存储在手边的硬盘或云存储设备上。我们还可以备份驱动器或更永久的介质,并附上如何长期存储的说明。


这听起来像是一个十分无聊枯燥的行为,但它也可以很有趣。可能只需一场文化运动来激励我们前进。


在音乐流媒体时代,许多发烧友仍坚持买黑胶唱片。书迷们仍会大费周章地获取他们最爱的作者的新作印刷本。也许我们需要保护主义者发动一场非数字运动。他们致力于重新制作实体相册。他们不厌其烦地手写笔记或信件。这些东西最终可能比任何数字化的东西都更容易保存,数字化的东西可能永远都要求你去信任一个由他人建立的系统,或者一个他人所有的服务机构。


正如多诺万所说,“如果某些东西很宝贵,那么我认为,把它留在别人手里就很危险。”


原文/www.bbc.com/future/article/20210715-the-online-data-thats-being-deleted


本文来自微信公众号:利维坦(ID:liweitan2014),作者:Chris Baraniuk,翻译:Leeway,本文基于创作共享协议(BY-NC),由Leeway在利维坦发布