作为互联网民,我们每天在消费内容的同时也在生产内容,你知道每天互联网产生的数据量有多少吗?根据云数据处理公司 Domo 的统计,2020 年每天产生的数据量约达 1.145 万亿 MB,如果用硬盘将这些数据全部储存起来,每天能填满一百多万个 1TB 硬盘。



互联网就像是一个深不可测的大海,每天都有新的「潮水」涌入,但很少人察觉到的是,互联网数据消失的速度并不比这慢多少。一个博客网站的倒闭、一家服务器商的故障或者是遭遇一次黑客恶意入侵,都能导致一些互联网数据在世界上彻底消失,这其中有可能包含了摄下珍贵回忆的照片、记录下历史的关键文件,随着原始数据的消失,这些都将会被人类永久遗忘。



为了将这个由字符组成的文明尽可能地保存下来,美国的一家名为互联网档案馆(Internet Archive)的非营利性数字图书馆,收集了大量的网页、视频、音频、软件和电子书。互联网档案馆从 1996 年起利用网络爬虫抓取了大量网页并存档,至今已经超过 3510 亿个网页,其称为「时光机」(Wayback Machine)项目。



「时光机」的页面非常简洁,只有一个输入栏和搜索按钮,有点像 Google 等搜索引擎。在输入栏输入你想「回到过去」的网站,选择想要穿越日期,就能查看当天被保存下来的网页截图。



2007 年 11 月 2 日的饭否即使是一些因为经营不善等原因而早已不复存在的网站,你也很大几率能在「时光机」找到历史备份,这也是互联网档案馆的理念之一:将脆弱的互联网信息保护起来。2021 年正好是互联网档案馆诞生 25 周年,它已经记录了近四分之一个世纪的互联网历史,为了纪念这个特殊的节点,互联网档案馆对它们的时光机做了一些「改造」,这次它们不仅想记录历史,还要带你「回到未来」。

2046 年的互联网还会好吗?互联网档案馆的新项目名为 Wayforward Machine,同样是一台时光机,不过它的作用是带你穿越未来,时间是 2046 年。



「未来时光机」的页面保留了「时光机」的简洁风格,黑客帝国般的黑绿色配色又给它增添了一点科技极客的未来感。在中间的地址栏输入网址,就能提前看到它在 2046 年的模样,怀着些许紧张和激动的心情,我敲下了 www.Apple.com,想看看 iPhone 38 有没有用上 65W 快充。



经过耐心地等待,这趟穿越 25 年的跳转终于完成,然而首先列入眼帘的并不是熟悉的黑白 Logo,而是一个严肃的「警告」,需要我提交个人信息才能浏览。



跟着引导填入了姓名、住址、手机号、年龄、性别等一系列个人信息后,我依然不能进入网站查看 iPhone 38,并且事情变得诡异起来:网站索取的信息越来越私密,从邮编编码到我的体重、身高等生理信息,并且怎么都填不完。我再尝试浏览 2046 年的任天堂官网,看看新的 Switch 有没有用上 4K mini LED 屏,果不其然也遭到了阻拦。



网站提示我需要完成生物信息认证,并「人性化」地提供了视网膜和指纹两种方式认证。更「过分」的是,如果我同意认证,便会默认接受广告商根据我的生物数据推送个性化广告。当然,这一切其实都不是真实发生的,「未来时光机」并不会扫描的你生物信息,也不会记录你的隐私数据,更不会真的模拟出 2046 年的网页,这都是互联网档案馆策划的一场行为艺术般的恶作剧。无论你在「未来时光机」输入什么网址,它都会用各种弹窗将你阻拦,而这些「网络障碍」,其实就是互联网档案馆认为的互联网未来。



当 2046 年的你想要去某个音乐网站找童年听的《修炼爱情》,可能会发现那个网站早在 2029 年就被关闭了,曾经记录下数十万人深夜感伤的评论故事也随之一起消失。



又或者是当你前往一些博客网站想要查阅资料时,可能会遇到网站所有者屏蔽了公共浏览,并将其内容的版权保护延长了 200 年。互联网档案馆对于 2046 年互联网的想象充满了反乌托邦色彩,其中有些猜测不免过于大胆且激进,但互联网从原来标榜的「自由」和「开放」正慢慢走向封闭正成为一个不争的事实。



图片来自:The Atlantic

坏链问题是导致信息封闭的一个重要原因。在今年六月,《大西洋月刊》发表了一篇题为《互联网正在腐烂(The Internet is rotting)》的文章,作者 Jonathan Zittrain 和同事从 2014 年起就网页链接失效问题做了一系列研究。以权威的学术期刊《哈佛法律评论(Harvard Law Review)》为例,其 75% 的引用链接早已失效,这意味着,如果坏链问题持续发展,在不久的将来人们将会遇到事实监管链全面崩溃的窘境——没人能辨别事实的真伪,因为没人知道真相。除此之外,越来越多的个人资料审查、监管条例的发布也让互联网档案馆对互联网未来感到悲观。



为此它预测了互联网未来 25 年将可能发生的大事件时间线,例如 2024 年将会通过严厉的数字版权法案打击免费知识、2034 年全球最大的三家出版商合并垄断数字媒体、2046 年互联网档案馆将会被迫转入地下活动。而其「时光机」项目早在 2025 年就会被迫终止,事实上,互联网档案馆目前已经收到了四家出版商的起诉。



一丝不苟地记录历史、分享知识,是在与未来做斗争通过「时光机」,你可以找到许多有意思且有意义的东西。



例如你可以见证苹果官网是怎么从「丑小鸭」一步步变成「白天鹅」。它不仅记录着网站的设计变迁,也记录了一个时代的变化,但由于其免费向人们开放数字内容的行为,互联网档案馆正受到越来越多出版商的反对。



在争取知识开放的道路上,互联网档案馆并不孤单,另一个饱受争议的知识网站 Sci-Hub 也在今年引来了十周年纪念。Sci-Hub 在科研圈几乎是一个人尽皆知但不能说的秘密:你可以在这里绕开付费墙免费下载几乎所有你想看的科学论文,既不需要注册也不需要订阅。其目的是推动知识开放和传播,然而从商业的角度来讲,这种行为却是侵权的。



图片来自:FuturismSci-Hub

创始人亚历山德拉·埃尔巴金在 2017 年被学术出版商巨头 Elsevier 的起诉,要求赔偿 1500 万美元,然而这一行为并没受到研究者们的支持。有人说互联网档案馆、Sci-Hub、EEF 等网站是版权时代的反叛者,是资本林立的互联网世界中的异类,也有人评价其为保存互联网火花的最后一批守护者。



互联网档案馆创始人 Brewster Kahle 图片来自:The New York Times

没人知道抵着法律红线的它们何时会停下对抗的步伐,但它们的创始人在不同的采访中都释放出相同的信号:他们会一直坚持,直到没人支持。最后可能有些朋友会好奇为什么「未来时光机」选择的是 2046 年,是不是受到王家卫导演的影响?其实这只是因为到 2046 年,互联网档案馆刚好记录下了互联网半个世纪的历史——到时如果互联网还存在的话。