本文来自微信公众号:智本社(ID:zhibenshe0-1),作者:清和社长,题图来自:视觉中国
2021年4月19日,上海车展上一位特斯拉车主身穿“刹车失灵”白T恤站上车顶维权。特斯拉方坚称,刹车未失灵,对方搞事情。紧接着,网络媒体上掀起了一场声势浩大的“讨特”运动。
公众舆论迅速聚焦到一个点:行驶数据。
三天后,特斯拉对外公布了车辆事故发生前一分钟的数据。数据显示,刹车前车辆时速为118.5千米每小时,驾驶员刹车后车辆持续降速,时速降至48.5千米每小时时发生碰撞。从第一次刹车到碰撞间隔时间约为4.5秒左右。
数据公布后,吃瓜群众逐渐散去,热度迅速滑坡。但是,车主家属指责特斯拉侵犯个人隐私权,要求撤销数据。同时,一些人质疑,特斯拉可能修改过数据。
这起特斯拉维权事件终于把数字经济的关键问题推到了前台:数据的产权界定、隐私保护以及风险监管。本文从经济学的角度分析大数据时代的数据产权及监管问题。
1. 数据产权界定
在之前的反垄断事件上,我写过几篇文章指出,互联网平台垄断的关键问题,不是市场支配地位和巨额补贴,也不是资本泛滥和无序扩张,而是垄断和滥用私人数据。
我曾在《蚂蚁的野心》中指出:“如果个人数据的产权无法私有化,那么将货币发行权交给大数据银行那是灾难性的。”大数据杀熟、信息茧房以及网络信贷问题,根本上是私人数据被平台垄断和滥用。如今,无人驾驶汽车的数据问题似乎更加急迫——直接关系到驾驶员生命安全以及事故责任的认定。
数据产权到底归谁?
第一类信息是从公共信息中收集的数据。
有人认为,数据本身是公共资源,按照“谁付钱归谁”的原则,互联网平台花费了成本搜集、储存和维护大数据,大数据的产权归属应当是平台。按照这种观点,特斯拉的车辆行驶数据的产权不归车主,而归特斯拉。
在大千世界中,宇宙中的火星、道路上行驶的汽车和全球流行的新冠病毒,都是一种信息的存在。这些信息是无主的公共信息。但是被收集的信息是有主的资源,谁为搜集的数据支付成本,数据的产权就归谁。值得注意的是,公共信息与被收集的数据是两个概念。事实上,每个人都在想方设法地收集更多更有效的公共信息,然后做出相应的决策。很多公司会将大量的市场信息形成有效的数据统计,股票交易员每天搜集大量的价格信息及行业信息。这种产权的界定原则在美国法与经济学家波斯纳的《法律的经济学分析》中有详细论述。
但是,这里有个前提,所收集的信息必须是公共信息,而非私人信息。何为公共信息?第一空间上是公共的。比如,你可以在大街上统计多少人穿耐克鞋,但是不能侵入私人家庭窥探。你可以在股票市场上统计量价信息,但不能侵入私人账户窃取信息。第二对象上是公共的。比如,你可以统计多少男人或女人进店,但是不能跟踪偷拍某个客户或每一个客户的购买行为。为什么私人空间和私人对象上的数据收集是不正当的?因为私人空间和私人对象具有产权归属,比如私宅和隐私权。这些数据,即便是花费成本获取的,也是不正当的,属于对他人的产权构成侵害。
第二类信息是因交易及服务必要而提供的个人数据,如个人身份证、联系方式等。所谓交易及服务“必要”,主要是为了降低交易费用。比如,双方提供身份证、营业执照有助于降低信任成本。又如,住酒店登记身份证,乘坐飞机过安检检查包裹,都是为了降低交易风险。
所以,交易者会“让渡”出部分个人信息(权益)以降低交易风险,或换取公共安全。但有人误以为个人信息在这次交易中也被交易出去。其实不是,这些信息的产权依然是个人,产权没有发生变化。个人之所以提供信息,是为了促进交易,降低风险。对方以及任何个人,未经当事人允许不得占有和使用他人数据。这一点是明确的,比如我们在签署合同附个人身份证复印件都会注明“仅限于本合约”或“复印无效”。这么做的目的是防止个人信息被滥用。
第三类信息是因交易及服务而产生的数据,比如交易价格、交易数量、付款周期及合约信息。这类信息的归属权在交易双方,由双方协商是否公开交易价格及合约信息。在一些交易中,双方约定不公开价格。通常,为了降低交易成本,很多人愿意公开价格,但不公开交易个人信息。比如,深圳用指导价调控楼市后,交易价格迅速消失,给交易带来不便。又如股票交易市场,我们可以看到每一笔交易的价格,但是无法知晓交易对象及更多个人信息。但是,交易所为何要求大宗交易公开信息?道理与上面类似,为了降低大宗交易的风险,避免内幕交易,上市公司及大宗交易对象需要做到信息公开。这相当于公开部分信息来促进交易。
以智能驾驶汽车为例。特斯拉的优势是拥有几百万台汽车每天在道路上行驶,它可以获得大量真实的行驶数据来提高它的智能驾驶技术。哪些数据该收集,哪些数据不该收集?数据的产权归谁?
特斯拉可以通过外部摄像头和传感器收集外部公共信息,比如识别道路上的行人、汽车、红绿灯、危险物等。这些针对外部公共信息收集的数据归属于特斯拉。无人驾驶系统正是通过对外部信息的收集、识别及处理,然后做出驾驶决策,从而提高安全性。如果车主危险变道和跟车太近,特斯拉辅助驾驶系统都会报警,如果车主没有采取措施,该系统会强行干预。
斯坦福教授吴恩达曾在谷歌无人驾驶汽车项目中建立人工神经网络。这个网络具备深度学习的功能,它在YouTube上看一周的视频后,可以自主学习识别哪些是猫的视频。这个技术如果运用到无人驾驶汽车上,可以用来识别车辆前面的物体是猫还是小孩,帮助无人驾驶系统执行合理避让。
但是,无人驾驶汽车不能在未经车主允许的情况下对内实施监控,收集车主的个人行车数据。车主的个人行车数据,包括行车里程、行车位置、行车速度、刹车次数、变道次数、乘坐人数、车内对话、交通事故、违章次数、保养维修、驾驶习惯等等。
不过,其中有些个人信息,因交易及服务必要而需要向汽车厂商提供,比如对行车速度、发动机、安全带、油量电量的监控数据。汽车在交易结束后,服务才刚刚开始,汽车厂商对汽车安全负有一定的责任,对必要的行车速度、发动机安全等数据进行监控,并起到提醒作用。如今,对这些安全数据的监控已是汽车产品质量标准。
智能驾驶汽车对数据的依赖性更大。无人驾驶或辅助驾驶,不仅需要外部数据,还需要大量的个人行驶数据。比如,辅助驾驶系统采取紧急避让,必须结合当时行驶的车速来判断。又如,辅助驾驶系统会分析车主的不良驾驶习惯并加以提醒和纠正。而这些都依赖于对个人行驶数据的监控、搜集及处理。
问题来了,哪些是因交易及服务必要而提供的个人信息?车内对话、乘坐人数、个人肖像不属于交易及服务“必要”。不过,美国联邦通信委员会许可特斯拉及五家公司使用雷达传感器,在可疑活动发生时对车内人员及环境进行监控。
除了普通汽车涉及的安全数据外,智能驾驶“必要”数据或覆盖行车里程、行车位置、行车速度、刹车次数、变道次数、交通事故、违章信息、保养维修、驾驶习惯等大量数据。
这类数据的产权归属个人,但谁来保证不被滥用?
2. 数据资源配置
如今大数据时代的问题是,用户因交易及服务必要,“让渡”出了大量的个人数据,但又无法确保数据的安全性,甚至还深受其害。
比如网络购物数据。在电子商务平台使用搜索引擎购物,好处是降低了搜索成本,我们不需要全国各地找商家比价。但为此我们“让渡”了大量的个人数据。在平台上的搜索数据、浏览数据、讨价还价的数据等等,这些个人数据被平台收集,甚至可能运用于大数据杀熟。平台很可能为你量身定制了机票、沙发、电脑等商品的价格。
很多人将大数据杀熟与价格歧视混淆,每个商家就同一款产品都可以针对客人差异化定价。大数据杀熟不等于价格歧视。歧视性定价具有正当性,属于商家的定价策略。但是,歧视性定价是建立在有限的信息和平等的竞争地位之上,而大数据杀熟是建立在控制、滥用个人数据和不平等的竞争地位之上。大数据杀熟被认为是一级价格歧视。其实,在正常的竞争环境中,歧视性定价不可能做到大数据杀熟。
交易是一个平等博弈的过程,双方都想方设法获取更多的信息从而赢得更强的议价权。在每一笔交易中,双方所赚取的是交易剩余,即以更低的边际效用换取了更高的边际效用,中间的差额就是交易剩余。一旦所有用户的个人信息都被平台所掌握,那么交易的天秤向平台倾斜。互联网平台可以最大限度地榨取每一位用户的交易剩余。财富的天秤向人为的信息垄断方倾向,引发财富集中和社会控制。
有人认为用户“让渡”必要的个人数据,换取了交易便利。但是,这里不能混淆两个问题:
一是“让渡”必要的个人数据,必须是自愿的,用户有知情权。
互联网平台需告知用户,他们对用户的“足迹”,包括搜索、浏览、购买、支付等数据进行搜集。对超出“必要”范围的数据监控,用户可选择反对,屏蔽数据采集。比如,在宜家购物,宜家的空间设计,让客户可以更好的搜索和体验商品。但是,宜家不能因提供了这种便利而监控客户购物行为。宜家只能提供必要的安防监控,并告知客户:公共区域,安防监控。
不论是线上还是线下,商家都必须告知用户:第一是对交易及服务必要的数据进行监控;第二是用户可选择屏蔽超出必要范围的数据监控。
二是“让渡”出去的必要数据,其产权也是归属个人,且禁止被滥用。
如果所有车主的行驶数据由汽车厂商控制,后者又将数据卖给保险公司,结果会怎样?保险公司可以根据每一个车主的数据量身定制保险方案,赚取最大的交易剩余,而车主则没有任何议价权。这是大数据杀熟。从保险公司角度来看,这是最有利的。但是,这违背了自由市场的平等规则。合理的做法是什么?
如果车辆行驶数据归属个人,车主可以使用个人的数据进行讨价还价。假如你的安全驾驶数据很好,你可以选择对保险公司公开这个数据,以降低保险公司开出的保费。假如你的安全驾驶数据很糟糕,你定然会隐藏这一数据,避免保险公司抬高保费。数据私有化后,用户才能拿自己的数据去讨价还价,最大限度地获取交易剩余。当然,保险公司也会想方设法去挖掘更多关于你的信息。这就是正常的市场博弈,也是经济增长的动力,而不是所谓的逆向选择。
所以,数据产权界定,数据才能得到有效配置和监管。用户也可以将自己的数据交易出去,当然交易也是有规则的交易。这样真正的数据交易市场才能形成。
目前的问题是互联网平台使用集中化数据库搜集和存储用户数据。技术创新正在打开这个困境。一些分布式网络不再集中存储用户数据,并实施端对端加密。除了端对端外,平台及任何第三方都无法得到具体数据。但是,无人驾驶级别的数据处理对分布式网络的效率是一个巨大的挑战。同时,分布式网络容易遭受双花攻击,将加大无人驾驶系统的风险。
特斯拉维权事件凸显了数据监管的滞后性。当特斯拉公布行车数据后,一些人质疑数据的客观性。数据是否被修改?
个人行车数据的产权不明确,特斯拉陷入两难:不公布数据,则涉嫌掩盖真相;公布数据,则可能涉嫌侵犯隐私。这个事件最后上升为公共舆论事件,消除公众疑虑最好的办法也就是公开行使数据。如果明确行驶数据归属个人所有,车主可向特斯拉调取行车数据,或者特斯拉经由车主同意公布行车数据。在整个维权事件中,监管部门应该发挥更大的作用。监管部门具备执法资格,向特斯拉调取车主的行车数据。同时,为了避免侵犯个人隐私,由监管部门对外公布相应的数据。
从特斯拉维权事件可以看出,未来的智能驾驶汽车,行驶数据是厘清事故责任的关键。过去,我们通过检测刹车硬件来判断刹车是否失灵。如今,汽车开始由无人驾驶系统干预、接管,刹车是否失灵、是否系统自动加速,只能由数据说话。
在美国,互联网巨头及民众对政府调取用户数据极为敏感。推特、苹果公司都曾多次拒绝联邦政府的要求。2014年推特公司状告美国联邦政府,理由是联邦政府强迫他们交出用户数据。最后,推特胜诉。但是,这些社交媒体及科技巨头却因此手握审查权,成为了信息的仲裁者、真理的仲裁者。
社交媒体及科技巨头利用对用户数据的控制给用户编制了一个个信息茧房。这个问题在推特封杀特朗普事件中为世人所知。如今,行车数据监管难题或许是一个更加棘手而明确的问题。未来,越来越多的事故需要通过数据公开来划定责任。
所以,如何监管行车数据是摆在政府面前的一个难题。在分布式技术尚未成熟之前,第三方数据加密存管或许是一个解决办法。特斯拉等巨头将大数据存放在第三方平台,车主拥有所有权,车主授权给特斯拉无人驾驶系统使用,第三方肩负数据安全责任。政府可通过第三方来调取和监管行车数据。
3. 数据风险监管
假如无人驾驶或辅助驾驶系统干预引发交通事故,汽车厂商需要承担责任吗?
比如,我正在驾驶汽车危险变道,辅助驾驶系统识别出车辆正处于危险变道中,迅速强制干预,车辆回到原来车道。而我之所以危险变道,是因为我判断到隔离带对面车辆将要发生碰撞事故,进而实施紧急躲避。假如辅助驾驶系统没能识别这一信息,强制干预我变道,对面车辆越过隔离带撞上我车。在这起事故中,假如逆行车辆负全责,但是辅助驾驶系统需不需要承担责任?这类的问题在辅助驾驶领域逐渐出现,比如因识别错误而突然停车。
这就涉及到无人驾驶信任问题。如何才能建立信任?
自由竞争是一个好办法,但要依赖于制度监管。事故率是判断汽车质量的一个重要指标。但是,如果数据不公开,我们并不清楚哪些事故是辅助驾驶系统造成的。公共部门需要对无人驾驶汽车建立数据标准。
第一个数据标准是数据输入标准。
允许汽车厂商收集哪些必要的车辆行驶数据,如行车里程、行车位置、行车速度、刹车次数、变道次数、交通事故等等。监管并规范这些数据的用途,这些数据只能运用于提高无人驾驶性能,保障驾驶安全。
第二个数据标准是驾驶技术标准。
无人驾驶的难度是对大量行驶数据的积累及智能化处理。欧洲国家对无人驾驶技术的实际应用相对谨慎。美国政界对无人驾驶汽车标准博弈激烈。开始各州对汽车制造商提高了无人驾驶汽车的投放门槛,需要符合75项汽车安全标准以及积累大量的道路测试数据。后来,联邦政府否决了地方的标准,试图将安全标准放低。
目前,谷歌无人驾驶车已积累了大量的行驶数据,在过去六年间制造了11起轻微事故。这一结果还是令人满意的。苹果公司在2018年就往加利福尼亚公共道路上投放了62辆无人驾驶测试车。
特斯拉的优势是每天都有几百万特拉斯在道路上奔跑,无人驾驶系统实时搜集及处理各种各样的真实道路数据和安全驾驶数据。这是一个打怪升级的过程,最有助于无人驾驶技术的进步。
但是,这也是风险最大一种方式。
中国正在掀起新一轮造车盛宴,众多巨头纷纷入局。巨头们急于造车,并不是他们掌握了无人驾驶技术或者电池技术,而是试图绕过发动机抢占无人驾驶赛道。什么意思?他们不造汽车,不是因为汽车不能搞无人驾驶,而是内燃机的技术难度太大。如今,电动车大大降低了造车成本。尽管电池续航有限,技术瓶颈不小,但是只要电动车上路,就有大量的数据输入到无人驾驶系统的“实验室”中。
目前及未来的一段时间是无人驾驶汽车风险系数相对高的阶段。在造车盛宴之下,巨头们纷纷“下饺子”,用真实的道路数据和驾驶数据推动无人驾驶的技术进步,是高效的,也是危险的。
有人认为,汽车厂商不会在技术不成熟的情况下启动无人驾驶系统或辅助驾驶系统。比如,现在这个阶段使用相对成熟的是自动泊车系统。这只能依靠汽车厂商的声誉机制。但存在两个问题:
一是无人驾驶系统缺乏一整套技术标准和参数。
目前,全球无人驾驶处于无标准的“裸奔”状态。国际没有出台针对这种带有自动驾驶功能的智能汽车检测的标准规范,中国的检测主要还是针对硬件设备的检测。
比如,无人驾驶汽车必须满足多少项安全标准才能上路?正如传统汽车的安全碰撞测试,必须满足多少项安全指标。又如,无人驾驶系统必须积累多少测试里程,完成多少安全识别任务,事故率在多少以下,才能上路?假如汽车时速在100千米每小时,前方突然窜出来一只狗或一个小孩,人工驾驶的紧急避让可能是不同的。如果是小孩,驾驶员一般会紧急刹车或紧急打方向躲避。如果是狗,驾驶员可能为了避免翻车而适当刹车或降速。如果无人驾驶技术不能识别狗和小孩的区别,会采取一样的避让措施。在上述模拟的事故中,如果无人驾驶系统识别到了对向事故,可能不会阻止我危险变道,或者会采取更加合理的避险选择。
二是无人驾驶系统缺乏监管。
如今,在市场上投放的无人驾驶系统是否安全?辅助驾驶系统是否安全?因为缺乏对无人驾驶技术的监管,我们并不清楚,厂商投放使用的新技术是不是真正过关,比人工驾驶更加安全。
这次特斯拉维权事件,有人怀疑背后有多股势力在博弈。抛开势力斗争,这次事件也算给世人提了一个醒:无人驾驶汽车正在“裸奔”。
所以,无人驾驶技术的可靠性很关键。而可靠的标准,正如汽车碰撞测试安全标准、极寒气候行驶标准一样,需要公共部门来建立,并施之监管。
国家技术标准的含义是什么?
回到上述的个人数据“让渡”问题。个人为何要让渡行车里程、行车位置、行车速度等行驶数据?目的是换取更加安全可靠的驾驶。但是,如果没有标准,车主并不清楚数据的“让渡”是否换来了安全。车主可能还会怀疑,如果人工驾驶,或许不会发生碰撞事故。如果没有技术标准,无人驾驶的事故如何认定?如果无人驾驶导致事故,这车算不算不合格,汽车厂商是否需要承担责任?
如果公共部门建立了技术标准,车主至少明白,让渡个人行驶数据换取了符合标准的自动驾驶系统。国家标准的建立,相当于在自由市场中借助国家信用为技术做背书。其中的含义,类似于国家的产生,每个公民让渡一部分个人权益(如私人刑罚权、纳税义务)来换取公共保障。尽管国家这种制度并不完美,但人类目前还没找到更好的替代品。
特斯拉维权事件过后,无人驾驶及数字经济时代的数据风险正在来临。
本文来自微信公众号:智本社(ID:zhibenshe0-1),作者:清和社长