来源|智本社(ID:zhibenshe0-1)

作者|清和

头图|视觉中国


2021年6月30日滴滴出行在美国纽交所上市。三天后,监管部门核实“滴滴出行”App存在严重违法违规收集使用个人信息问题,通知应用商店下架“滴滴出行”App,要求滴滴出行暂停新用户注册,认真整改问题。紧接着,监管部门对“运满满”“货车帮”“BOSS直聘”实施网络安全审查。


与以往的监管不同的是,这次提及“维护国家安全”。网络舆论上,数据安全问题迅速上升到国家安全层面,个人数据隐私与国家利益问题备受关注。


7月6日,深圳通过了国内数据领域首部基础性、综合性法律——《深圳经济特区数据条例》。该法坚持保护个人信息,打击大数据杀熟、过度采集个人信息、强制个性化广告推送,以及APP“不全面授权就不让用”。


本文继《算法,即剥削》后继续探讨数据特权、数据产权与数据主权。


01. 数据特权


十年之前,大数据科学家维克托·迈尔·舍恩伯格在其《大数据时代》中指出:“让数据主宰一切的隐忧”。他明确地说:“危险不再是隐私的泄露,而是被预知的可能性。[1]


此书虽语出惊人,但如今的世界正在实现舍恩伯格的预言,只是主宰一切的并非是数据,而是数据的掌控者。


数据是一种资源,也是一种权力。谁掌握了全民数据,谁便掌握了这项“预知”特权,从而支配思想,攫取财富,挑战政治。


对思想的支配,可以用一个词概括——“信息茧房”。2006年哈佛大学凯斯·桑斯坦在他的《信息乌托邦》中提出了信息茧房的概念。桑斯坦指出,在信息传播中,公众所接触的信息是有限的,会选择自己愉悦的信息,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中[2]


在古代,原始村落是一个个信息孤岛,是一个个天然的信息茧房。进入近代社会,报纸、电报、电视相继问世,信息权落到了知识精英手上。世纪之交,互联网打破信息孤岛,自媒体“逆袭”知识精英。人们认为自己置身于信息的海洋中掌控了信息主宰权,哪知道自己早已身处信息茧房之内。互联网技术精英借助算法悄无声息地夺权,给每一个人都量身订做了一个信息茧房。


美国反科技“狂人”希尔多·卡辛斯基曾在《论工业社会及其未来》一文发出警告:“工业化时代的人类,如果不是直接被高智能化的机器控制,就是被机器背后的少数精英所控制。[3]


极端左派的言论总是对权力之狼保持足够的警惕。在大数据时代,你以为自己拥抱了知识的海洋,其实技术精英想给你量身定制的深井。我们每天都生活在回音壁中反复地收听那悦耳的音符。支配了个人的信息,相当于盖住了人类的天灵盖,遏止了文明进步。


在信息茧房中,偏见盛行,理性堕落,戾气膨胀,温良沦丧。信息茧房促使逻辑形式化,思维简单化,认知标签化,理论特殊化,人愈加封闭、自我、无知、偏执、傲慢、群氓,且容易被人操控。一个个舒适的信息茧房里,暗藏着一股股盲目涌动的社会洪流。


再看攫取财富。个人在互联网平台上形成的数据,经过算法分析后,形成预测性功能。隐秘在用户深处的欲望、需求、情绪、情感可能被算法洞悉,平台可借此预测个人需求,推送不同信息,引导特别消费,实施价格歧视。


有人说,算法营销没什么不好,它比我自己还了解自己,满足我个性化需求。但是,当你发现被“大数据杀熟”后,自然就会反对这种算法营销。


问题出在哪里?问题就在平台掌握并滥用了用户的个人数据。


所谓大数据杀熟,是一种最高级别的价格歧视,即同一商品针对每一个不同的买家都采用不同的价格。在交易中,掌握充分信息的一方对信息贫乏一方构成议价优势。双方在博弈时一般会想方设法隐藏一些关键信息,同时试图获取对方的信息。通常双方获取的信息不会差距太大,企业做不到大数据杀熟。但是,在互联网上,平台掌握了充分的信息,有条件对用户实施大数据杀熟。


有什么危害?


平台无尝地控制用户信息,实施大数据杀熟,会剥夺消费者剩余,最大限度地攫取社会财富。


这里,我需要引入一个经济学概念,即英国经济学家马歇尔在1890年《经济学原理》中提出来的消费者剩余[4]。所谓消费者剩余,是指消费者在购买一定数量的某种商品时愿意支付的最高总价格和实际支付的总价格之间的差额。


什么意思呢?


之所以会发生交易,不是因为等价交换,而是溢价交换。张三用一个苹果与李四交换一根香蕉。张三吃腻了苹果,此时他认为香蕉更好吃。对张三来说,一根香蕉带来的边际效用(边际价值)要大于一个苹果。对李四来说,则恰恰相反。如此,二人交换,均获得溢价,皆大欢喜。这就是自由交易增进效用、增加财富的逻辑。


这个溢价就是消费者剩余。比如,这部手机标价3000元,你愿意支付的最高价格是3500元,那么多出来的500元就是消费者剩余。注意,消费者剩余不是心理财富,而是真实的财富。交易带来财富增加,这增加的财富正是消费者剩余。


平台掌握了每一个用户的数据,对每一个用户都索取了其愿意支付的最高或较高的价格,从而赚取了所有用户的全部消费者剩余或大部分消费者剩余。比如,平台通过你的购买记录识别出你是一位高净值用户,然后针对你的偏好调高商品价格。又如,当你急于购买机票出行时,平台识别到你急切的需求,然后针对你整体调高就近班次的机票价格,你只能无奈接受(换平台可否?下面讨论)。


这里有一份研究数据。根据美国布兰戴斯大学经济学系助理教授Benjamin Shiller,基于Netflix的研究发现,使用传统人口统计资料的个性化定价方法,可以使Netflix增加0.3%的利润,但根据用户网络浏览历史,使用机器学习技术,来估算用户愿意支付的最高价格,可以使 Netflix 的利润增加14.55% 。


可见,互联网平台可以通过掌控用户数据而最大限度地收割消费者剩余,最大化地攫取用户财富,加大社会财富失衡。这是一个危险的趋势。


最后我们看挑战权力。舍恩伯格曾在其书中预言,政治权力将让位于大数据及其掌握者。


从奥巴马时代开始,大选团队便开始大规模使用算法争胜。2020年大选,平台对大选的影响为人们所感知。在大选之前的半年里,美国社交媒体上广泛传播的三个议题: 拜登儿子亨特 · 拜登的硬盘故事,邮件欺诈投票,还有“我无法呼吸”——弗洛伊德被“跪压”致死案。前两个对拜登不利,后一个对特朗普不利。


美国社交媒体如何分配流量可以很大程度上左右舆论。这次大选,摇摆州的选情对最终的大选结果起到了决定性作用。平台在摇摆州的流量分发,可以影响选情。比如,拜登儿子亨特 · 拜登的硬盘故事在摇摆州宾夕法尼亚州的传播热度远不及佛罗里达州。


在选举期间,推特限制“邮件欺诈投票”的信息传播。推特将特朗普及其竞选团队所发布的这一信息标记为“滥用和误导性”,并限制其流量。选举日后的第二天,特朗普超过一半的推文被标记“滥用和误导性”,其推特及其它一些社交账号最后被封杀。另外一则信息,“我无法呼吸”——弗洛伊德被“跪压”致死案,则一直被广泛传播。在这次大选中,推特及互联网平台掌握了信息审查权,替代了美国联邦大法官,成为了信息的仲裁者、真理的仲裁者。


02. 数据产权


到这里,我需要消除两个误区。


一、问题在平台占有和滥用用户数据,而不是信息推送、算法营销和定价策略。


每个企业及个人都可以想方设法获取各类信息,实施不同的定价策略和博弈策略。在一个自由公平的竞争环境下,不会出现信息垄断和大数据杀熟。获取信息和价格竞争是企业争胜的手段,也是经济增长的动力所在。每个人都在想方设法地收集更多更有效的信息,公司会将大量的市场信息形成有效的数据统计,股票交易员每天搜集大量的价格信息及行业信息。


但是,所收集的信息必须是公共信息,而非私人信息。比如,你可以在大街上统计多少人穿耐克鞋,但是不能侵入私人家庭窥探。你可以在股票市场上统计量价信息,但不能侵入私人账户窃取信息。你可以统计多少男人或女人进店,但是不能跟踪偷拍某个客户或每一个客户的购买行为。个人数据有其明确的产权归属,互联网平台占有并滥用个人数据——建立在数据之上的一切竞争策略都缺乏正当性。


二、靠竞争和技术无法解决所有问题,需要借助法律(制度)的正当性。


有人提出,消费者可以用脚投票来躲避大数据杀熟。实际上,用户走到哪个平台,哪个平台都具备大数据杀熟的条件。因为用户数据均被平台掌握。当大数据杀熟被人人喊打后,会不会有平台放弃用户数据,拒绝大数据杀熟?定然会有,有些平台会利用区块链技术,实现数据私有化。但是,技术是中性的,平台也可以利用区块链技术追踪个人数据,实施更加隐秘的算法控制。


自由竞争与技术应用,不能离开公正的制度约束。公正的制度根本上不是来自大多数原则,而是人的行为正当性。互联网平台的关键问题,不是市场支配地位和巨额补贴,也不是资本泛滥和无序扩张,而是垄断和滥用个人数据这一不当行为。


可是,在信息时代,数据产权归属是一个尚未解决的关键问题。法学家可以借助经济学的产权理论来界定数据产权归属的正当性。


数据产权到底归谁?


有人说数据产权应该归属国家,国家是个大筐,什么都可以往里装。数据产权归属,不能凭直觉主义和爱国主义,而要借助逻辑主义论证其归属的正当性。


有人使用科斯定律来解答,即在交易费用为零或足够低的情况下,不管资源最初的主人是谁,资源都同样会流到价值最高的用途上去。通俗说就是:“谁用得好就归谁”。用科斯定律解释产权问题,是对科斯定律最大的误解。罗纳德·哈里·科斯所表达的是帕累托最优状态,并不是说初始产权的界定不重要。法与经济学家里查德·波斯纳在《法律的经济学分析》中,吸收了功利主义思想来界定初始产权。


这里,我引入更加纯粹的奥地利学派穆瑞·罗斯巴德的产权理论。罗斯巴德的一些言论会比较极端,但其从自然法的角度重塑产权的逻辑,显得更加通透,且更具正当性。罗斯巴德从人权出发讨论财产权,他说:“财产只能发生在人的身上,职是之故,他们的财产权利就是属于人的权利”[5]


从人的权利出发,我们的生命、大脑及手脚都属于个人所有。一个人主动地自愿地把自己的生命交给另外一个人,比如请求对方杀死自己,这种“托付”缺乏正当性。我们个人的生命及身体所衍生、产生的“财产”,如言论、设计稿件以及劳动成果,很自然也是我们个人所有。


我们用大脑和嘴发表的言论,这些言论的产权归属个人所有,个人享受该言论带来的收益,也承担该言论带来的后果。如果你一语道破天机,像欧几里得一样说出了“过两点能作且只能作一直线”,你便享有这一平面几何公理的占有权、使用权、收益权和处分权。当然,你如果说出“我爸是xx”,也要为此付出相应的代价。


由此我们推演到数据产权上,言论是一种信息,也是一种数据。这种数据的产权,从人权中衍生出来,因而归属个人。同时,我们个人生命与身体信息如脸部数据,以及由生命与身体衍生出的数据,如足迹、手印、个人身份等,均归属个人。


个人的指纹、脸部信息,以及“足迹”数据,不能被平台及任何人随意收集和滥用。这里主要讲“足迹”,我们逛超市走到哪里、拿了什么物品,都会留下“足迹”;同理,我们在互联网平台上购物、打车、搜索,也会留下“足迹”。这些“足迹”归属个人所有,超市和互联网平台不能偷拍、偷录和收集。要注意,互联网平台大量搜集的个人数据便是该类非结构性数据。


在交易中,为了降低交易费用,增加安全性和信任感,我们会“让渡”出一部分个人信息,如住酒店登记身份证,乘机脸部识别安检。对方收集了个人数据,但这些数据的产权依然归属个人。而且,所提供的个人信息仅限本次交易使用,未经当事人允许不得另作它用。比如我们在签署合同附个人身份证复印件都会注明“仅限于本合约”或“复印无效”。又如,超市和互联网平台处于公共安全的角度实施必要的广义的监控,超市的摄像头监控盗窃和火情,互联网平台算法监控毒品、色情和枪支交易。这也是用户“让渡”了部分个人信息以换取更加安全的交易环境。


接下来的是交易产生的数据。交易产生的数据,比如交易价格、交易数量、付款周期及合约信息,不一定是个人单独创造的,还可能是交易双方或多方共同完成的。比如我从卓越世纪打滴滴到海岸城,这笔交易会产生价格、时间、线路等数据,这些数据由我、接单司机和滴滴平台协作产生。那么,交易产生的数据归谁所有?


按照上述罗斯巴德的逻辑,交易产生的数据归属交易双方或参与多方共同所有。这类数据的处理比较灵活,通常由双方或多方约定。比如一家公司获得一笔巨额投资,交易双方可能选择公开具体交易信息,试图引起市场的关注。通常,为了降低交易成本,很多人愿意公开价格,但不公开交易个人信息。比如,如股票交易市场,我们可以看到每一笔交易的价格,但是无法知晓交易对象及更多个人信息。


关键问题来了,互联网平台共享交易数据的产权,是否可以随意使用交易数据?


交易数据产生于当下交易,也仅限于用于当下交易与一般性统计——经营和财务数据统计。所谓一般性统计,互联网平台可以统计交易数据做销售预测,如本月泳衣销量上升,需要备多少货。但是,没有个人授权或多方协商一致同意,互联网平台不能将某次交易数据另作它用,如算法营销。


有个真实案例,美国一男子闯入一家 Target 店铺,对着经理大吼:“你们竟然给我 17 岁的女儿发婴儿尿片和童车的优惠券,她才 17 岁啊!”一头雾水的店铺经理连忙向对方道歉。可一个月后,该男子发现女儿的确怀孕了。事实上,Target采用了一套数据挖掘系统实施算法营销。他女儿曾在Target 店铺购买与怀孕相关的产品,Target使用了这次交易的数据给其建立了一个孕期算法推销以及未来几年的婴幼儿算法推销。


这个案例的问题在哪?主要是孕妇的一次交易数据,在没有其授权的情况下被商家另作它用。如果个人数据被禁止获取,以及交易数据又被限制使用,那么互联网平台像线下商家一样很难实现数据侵占和实施大数据杀熟。


从自然法的角度去界定数据产权,逻辑会更加清晰和过硬。如今的互联网技术完全可以实现数据产权私用化,个人数据储存在用户个人手机、汽车或云端。只要不收集非结构性数据,个人数据量并不大,个人也可以选择删除,或者购买空间存储。最重要的是,国家应该依据数据产权归属的正当性,出台法律确定数据产权


03. 数据主权


过去,数据问题一直停留在个人隐私与大数据杀熟,但是滴滴出行被监管事件将数据安全上升到国家安全层面。如今,互联网巨头及大型科技企业掌握了“全民”数据,它们出海融资、全球贸易,容易触发数据对外泄漏的敏感神经,卷入国家利益的角逐战中。


2020年,特朗普政府曾以TikTok和Wechat涉嫌将美国用户包括联邦工作人员的个人信息如网络位置信息、浏览和搜索信息等未经许可对外输送,可能损害美国国家安全为由,禁止了这两款产品在美国的使用。


美国与欧洲之间的数据主权之争由来已久。从当年斯诺登的棱镜门,到今年的窃听门,欧洲政客一直对美国的信息控制感到不满、担忧和无奈。美国Facebook、谷歌、微软几乎垄断了整个欧洲市场,欧盟怀疑微软等跨国公司也参与了美国的监视项目。推特封杀特朗普账号,令默克尔等欧洲政客震惊,他们担心强大的美国社交媒体可能干扰欧洲国家的选情。


一些欧洲的极左政客鼓吹发动一场欧洲的“数据主权保卫战”。德国经济部长西格马尔·加布里尔直言:“美国正在危害我们的国家安全……我们的偏好、我们的行踪和我们犯的错误都在被不断地收集和保存,这些数据将被提供给广告客户、医科研究员、汽车保险公司、政治战略家甚至政府的间谍。”德国左派政客加布里尔发出“卡辛斯基式”的警告,只是带有强烈的民族主义情绪:“欧洲人必须积极行动起来进行自卫,否则就会沦为数字霸权下的奴隶。”


欧盟也对谷歌、Facebook等美国巨头大打出手,常常以反垄断之名严惩它们。同时,欧洲通过了《一般数据保护条例》(GDPR)来保护个人数据,降低科技巨头滥用欧洲人的私人数据。


美国国际政治学家小约瑟夫·奈曾在《理解国际冲突:理论与历史》第八章中谈到信息与国家权力问题,他预言:“一场信息革命正在改变世界政治,处于信息技术领先地位的国家可攫取更大的权力,相应的,信息技术相对落后的国家则会失去很多权力。[6]


在全球民族主义、国家主义和民粹主义大势下,数据主权(信息主权)会迅速升温,成为国家间斗争与博弈的“新战场”。


如何改变?


所谓国家主权,国民通过集体行动让渡部分个人权利形成的公权力。数据主权是国民让渡部分数据私权形成的数据公权力。而全球化的过程又是国家主权不断对外让渡的过程。二战后,经济全球化浪潮迭起,很多国家都不同程度地介入到全球化之中,或多或少地让渡了一些主权,如关税、财政、货币及关键资源政策等。数据主权的强化以及博弈的升温,是一条相反的道路。


最近300多年来,全球化自由市场是一条通往繁荣与和平之路。尽管它一直备受争议,但是目前人类还没有找到第二条取而代之的道路。而自由市场的重要前提之一便是明确国民个人产权。


国民个人产权对国家冲突的抑制有其可靠的逻辑。


一是国民享有产权分散了权力与资源,避免了集中化风险。


不论是古代战争,还是近代世界大战,都是国民经济力量集中化的结果。如果所有公司股权国家化,所有家庭房产国家化,原本属于个人间的国际贸易就会变成国家行为,充满着国家意志。国际市场上个人之间的股权交易、房产交易,却是极为普遍与和平的。


如今,全球范围内的数据主权博弈最大的挑战是个人数据掌握在互联网平台及大公司手上。这股集中化的数据力量,无法像个人数据一样分散风险,相反容易触发国家间的数据主权冲突。比如,Facebook、谷歌等掌控着欧洲用户的数据,这些平台是否利用流量分发模式,干扰信息流通和信息检索,进而影响欧洲国家的大选及其民主政治?尽管我们很难证实这种可能性,但这并不重要。掌握个人数据的互联网平台本身缺乏正当性,陷入百口难辩之境地,正如扎克伯格在国会上的窘境。这给欧洲极左政客以把柄,激发他国的民粹政治热潮,引发数据主权斗争。


二是国民享有个人数据具有正当性,同时还具备经济效率。


上述罗斯巴德用自然法阐述了个人产权的正当性。个人产权的激励性,正来源于其正当性。经济学家一直没有弄明白,正当性才是经济效率之源。换言之,正当性比经济学坚持的功利主义更为根本。


亚当·斯密有着容易被人忽略的论述:“每个政府体系的首要目的都是维护正义,以阻止某些社会成员侵害他人财产,或者攫取不属于他们的东西。这一目的就是让每个人可以安全和平地拥有自己的财产”[7],“建立一个对产业来说能够承受对政府,产业所需的唯一激励,不过就是能使其享有劳动果实的某种尚可容忍的保障[8]”。个人产权的正当性产生的经济激励,自发地形成无孔不入的交易网络,这一交易网络带来的财富增量,是社会稳定与世界和平的基石。


但是,如今全球科技巨头无偿地垄断了个人数据,抑制了个人数据的交易,降低了经济效率。没有个人数据产权,就没有数据交易市场。原本,全球化的数据交易市场,以及纵横交错的分工与协作关系,是抑制国家数据主权斗争的民间力量。欧洲的GDPR在个人数据保护上建立了极高的标准,某种程度上可以抑制美国互联网巨头对欧洲个人数据的滥用。但是,这一法案并未明确和释放数据的个人产权归属。


二战以后,世界走向繁荣与和平的另外一条可靠经验是有效的全球治理。但是,目前全球化旧秩序走向崩溃,全球治理正在遭遇灰暗时刻,数据主权斗争也因此升温。如何建立有效的全球治理成为了人类集体行动的重大难题。


哈佛大学经济学家丹尼·罗德里克在2019年6月递交给世界银行ABCDE华盛顿特区会议的一篇论文中提出一个入木三分的观点:“当今世界经济的大多数政策灾难是源于国家治理失败而非国际合作的缺乏。[9]” 


近百年来,国际冲突并非源自国际治理的失败,而是国家治理的失败。反过来,一个保护个人产权、支持自由生活、发展国民教育的国家治理,更可能参与建立有效的全球治理。因为有效的国家治理背后存在广泛的全球化创新力量和和平力量,如国际贸易、出国留学、跨国务工、技术合作、国际婚姻以及全球个人数据交易等。


更重要的是,有效的国家治理,促进发达的市场,反而更有效地保护和增进数据主权。虽然全球化在削弱国家主权,但是深度融入全球化的国家,都是国家主权保护最有效率的国家。比如欧洲国家对数据实施分类管理,德国要求跨国科技巨头的电信元数据实施本地化存储,法国要求医疗和通信数据限制出境。澳大利亚实施《个人控制的电子健康记录法》禁止可识别个人身份的健康数据向境外输出。


所以,即便在数据个人产权时代,国家数据主权的有效行使依然重要。如今,数据集中化、垄断化,加大了数据主权的风险。国家需要立法禁止个人健康数据、生物数据、遗传数据外流,防止被极端组织使用。


参考文献:


[1] 大数据时代,维克托·迈尔·舍恩伯格,肯尼思·库克耶,周涛译,浙江人民出版社;

[2] 信息乌托邦,凯斯·桑斯坦,毕竞悦译,法律出版社;

[3] Industrial Society and Its Future,Theodore Kaczyns ,The Washington Post;

[4] 经济学原理,阿尔弗雷德·马歇尔,廉运杰译,华夏出版社;

[5] 自由的伦理,穆瑞·罗斯巴德,吕炳斌、周欣、韩永强、朱健飞译,复旦大学出版社;

[6] 理解国际冲突:理论与历史,小约瑟夫·奈,张小明译,上海人民出版社;

[7] 亚当·斯密关于法律、警察、岁入及军备的演讲,坎南,陈福生、陈振骅译,商务印书馆;

[8] 国富论,亚当·斯密,谢宗林、李华夏译,中央编译出版社;

[9] 把全球治理放对地方,丹尼·罗德里克,余江译,比较2021年第1辑。


本文来自微信公众号:智本社(ID:zhibenshe0-1),作者:清和社长