今天,从画像、身体、位置、行为到情绪与心理、关系、评价,人的多种维度都有可能被数据化,甚至思维方式受到数据化的影响。


一、“画像”的数据化


对于网络服务的提供者来说,用户数据主要的使用方向之一,是对用户画像的描绘。


用户画像(persona)这一概念最早源于交互设计/ 产品设计领域。交互设计之父阿兰·库柏(Alan Cooper)较早提出了用户画像的概念,并指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型。


用户画像的内涵主要包含三个要素,即用户属性、用户特征、用户标签。除交互设计外,市场营销、媒体等常常会使用用户画像这样的说法。但在传统时代,由于数据获取困难,以及相关技术的难度,使得用户画像往往是“群像”的,并且这种群像是粗略、模糊的。


在新技术的支持下,今天的用户画像,除群体、整体等层面的描绘外,要获取针对个体用户的、精准的数据画像已经变成可能。其目标为揭示用户的自然属性、个性特点、兴趣偏好、行为习惯、需求特征等,甚至有些画像还能揭示出个体的政治倾向、态度立场等。


从目前的个性化服务的角度看,用户画像常常以“标签”的方式呈现,个体用户身上打上的标签越多,就意味着对用户的了解越丰富。针对个体的算法,常常是针对这些标签进行特定信息或产品的推送的。当然,用标签的方式描述用户也有着局限性,因为用户的行为往往是综合的、变化的。离散的、静态的标签未必能完整反映一个复杂的个体。未来的智能技术、数据分析技术也会改善用户画像的获取方法,使其更精细、更具综合性与动态性,即在不同的目标下,产生不同的数据化画像。


二、身体的数据化


用户“画像”这个词只是一个比喻,其实并不涉及“人脸”这样的身体部位,但随着移动终端、智能传感器等的发展,身体的数据化开始变得普遍。身体或身体“元件”(身体的某个部分)的特征、身体状态等数据,正成为用户数据的重要构成部分。


用户本身在不断进行着身体的数据化。在数字空间的互动中,数据化的身体是一种普遍的表演手段。例如,人们通过照片或视频对身体进行记录。有时这种记录是为了证明身体在某个现实空间的在场,表达某种成就感,并赢得数字空间的存在感。数据化的身体表演,也是人的自我认同的一种方式。英国学者安东尼·吉登斯(Anthony Giddens)在分析身体与自我认同的关系时指出,常规性的身体控制对于个体在日常互动情境中维持自己的保护壳十分重要。要想成为一个有能力的能动者,不仅意味着要保持这样一种持续不断的控制,还意味着要让他人见证自己的状态。


身体以实践方式参与到日常生活互动之中,便是维持一个连贯的自我身份认同感的重要构成部分。对身体外形的控制能力展现了人的自我控制能力和意志力。以图片或影像进行的数据化的身体表演与展示,提供了新的身体表演方式,给“身体”带来了新的应对外部情景和事件的“实践模式”。即使人们的身体实体不能随时调节,但通过拍摄时的设计与后期美化,它们也可以更好地配合或回应外部的情境。


为了这种表演,人们会强化某些方面的行为。例如,健身。有时为了社交表演,人们会对手机中的身体形象进行美化,甚至让原始照片彻底消失,使得这个维度的数据出现失真。社交平台盛行的身体(包括容貌)的视觉化表演,加深了基于身体的社会比较与竞争。人们的身体焦虑、容貌焦虑日益加深。数据化表演带来了人们的相互模仿、相互传染,并且这种相互影响会延伸到线下。


人的某个“元件”被数据化,与人的身体分离,进入数字空间,是人的身体数据化的另一种典型方式。例如,人脸、指纹、声音等身体“元件”,对于网络服务商来说,获取这些数据化的身体元件,主要是基于服务的需要,如提高服务的便利性等。但这也给个体带来了隐私和安全方面的风险。从社会管理的角度看,对这些身体数据的采集,对于社会风险的发现与处置有一定意义,但这也会使个体处于更严密的监控之下。


可穿戴设备对身体状态的数据化,在未来将越来越普遍,特别是在健康、医疗领域将得到广泛应用。对于病人、老年人等特定群体来说,用可穿戴设备进行身体状态监测可以帮助医生及时发现身体的异常动向,尽早做出诊治。而对一般人来说,可穿戴设备带来的数据,将成为身体表演与调节的手段或依据。


可穿戴设备完成的身体数据化,往往要通过网络传递出去,于是身体与网络之间形成了更紧密的连接。当越来越多的身体连上网之后,所谓的“身联网”(Internet of Bodies)就会成为现实,影响身体的因素也会变得更为复杂。


三、位置的数据化


今天的用户是内容网络、关系网络及服务网络等多种网络上的节点,正如在网络上每一台计算机都可以由一个地址来表示一样。用“位置”来测量每个用户,可以更精准地定位到每个用户。个体用户画像与其节点位置的结合,可以使用户分析更为精准、深入。


一方面,移动用户的物理位置是一个自变量,它的每一个变化都有可能导致与之关联的内容、社交与服务目标的变化。对位置及运动轨迹的数据记录与分析是一些应用服务的依据,如打车类应用、健身类应用。


另一方面,运动轨迹在某些时候能反映人在某些方面的“属性”。在智能化的社会管理系统中,物理位置将是最受关注的个人信息之一,在一些特殊情境下,本应属于个人隐私的部分,被要求无条件“交出”“公开”。


今天的物理位置数据只是涉及地理位置这一变量,但未来随着可穿戴设备或传感器的普遍应用,还可以“测量”某一地点相关的多种场景变量,如空间特征、自然环境(如空气质量等)、社会情境等。这些变量的结果也会数据化。


除物理位置外,对用户位置的理解还可以体现在关系网络中的位置、服务网络中的位置等,这两种维度的位置的数据化,正在实践中得到应用。


四、行为的数据化


将用户的内容生产与消费、社交活动、电子商务、劳动,甚至日常活动等各方面的行为数据化,在新媒体时代越来越常见。对于服务提供者来说,用户行为的数据化是他们描绘用户画像,理解用户的社会位置、服务位置的重要依据,是构建与用户相关的算法的基础。


用户在数字空间中自主发布的内容,是对用户行为数据化的重要方式。自主发布内容的行为具有双重含义,一方面,这些内容在一定程度上反映着人们的现实行为;另一方面,内容发布本身又是一种虚拟行为。两种行为既有相关性,又可能出现一定的分离。虚拟行为既是对现实的真实反映,又是对现实行为的回避或遮掩。社交媒体的内容是反映现实还是回避、遮掩现实,这种选择又构成了另一种行为。用户发布的内容传达了人们的思想、观念、观点等精神层面的信息。这些内容是对用户行为分析时的一种主要数据对象。


人们的点赞、转发、评论等就是典型的被数据化、被分析的行为,对这些行为的分析甚至可以揭示出人们的性格等特征。互动行为数据外化着人们的个性特征,以及人们之间的关系。未来对这些互动行为数据的研究也将越来越多。


搜索数据同样是行为数据化的一种体现,它不仅反映了人们对信息的需求,还在一定程度上反映了人们的行为动向与现实状况,如当人们搜索某些景点的信息时,可能是他们要旅游出行的前奏;当人们搜索某种疾病的信息时,可能意味着他们或家人身体出现了问题。对众多用户搜索数据的总体分析,还可以辅助研究者进行社会情状与趋势的分析。这是大数据应用的一种方式。


另一种重要的行为数据是支付数据,支付记录不仅与消费相关,还与人们的活动场所、活动性质相关,它是日常行为轨迹的数据化投射。


当下人们在手机、电脑中输入的任何信息,拍摄的任何照片、视频,以及不想被记录的谈话和活动都是行为数据,它们更直接、深层地反映着人们工作、生活中的细节,甚至个人隐私。这些本应由个人掌握的信息,却有可能被某些应用或平台“偷走”,成为分析数据。


劳动行为的数据化,是行为数据化中的一种特别情形。对于那些主要通过数字平台进行劳动的劳动者(无论是内容生产这样的精神劳动,还是送外卖、送快递、开网约车这样的物质性劳动),其劳动行为的数据化,更是成为典型。平台不仅可以将其成果数据化,还可以将其劳动全程数据化,从他们的空间位置、运动轨迹到劳动进度、时效、评价等。


数据化将普通用户的行为转变为数字空间里的劳动。例如,当用户阅读行为通过数据统计构成流量数据,进而成为平台影响力的衡量指标,甚至影响到广告投放时,阅读行为就成了劳动的一种。在克里斯蒂安·福克斯看来,今天所有的数字平台的用户,实际上就是运输工人,而且是免费替大平台和广告商运输商品意识形态的工人,是一种数字劳动者1。


为了社会竞争的需要,数据劳动正成为一种新的劳动行为,特别是粉丝群体,为了让自己的“偶像”获得更好的数据表现——也是影响力的外在表现,粉丝们需要通过打榜等方式“做数据”。


进一步分析,建立在行为等数据基础上的算法会反过来控制、诱导人们的行为。这意味着行为数据成了一种控制的基础。


在数字空间之外,现实空间无处不在的摄像头,也在将人们的现实活动转变为数据化的记录。这些数据对人们现实行为的反映更为直接、完整,并且发出每一个行为的人,从相貌到身体都会被记录。商家、管理机构等对这些数据的应用及基于数据的控制,也在日益加深。


五、情绪和心理的数据化


随着技术的发展,将人的情绪、心理状态等意识层面的对象数据化,变得越来越常见。


在各种对社交媒体的研究中,用户情绪的分析是一个重要方向。研究者可以通过人们自主发布的内容来分析其情绪倾向,这既可以是个体的情绪,也可以是群体或整体性的情绪。这样的分析结果,往往可以以数据的方式量化。


而眼动仪、脑电仪、皮电传感器等设备,则通过采集与分析人的视线移动、脑电波、汗液等生理信号,将人隐秘的内心活动变成显在的数据,从而精准判断人的注意力指向、大脑兴奋程度等。以这种方式对情绪、心理的揭示,不仅能描述总体状态,还能反映动态变化的过程。


六、关系的数据化


今天的人置身于复杂的关系中,包括人与人、人与内容、人与服务、人与机器、人与环境的关系等,这些关系被越来越多地以数据的方式描绘、计算。


社会学的社会网络分析方法,就是将关系数据化的一种典型方式。它不仅可以反映关系的有无,还可以反映关系的方向,分析在关系基础上形成的权力结构,凝聚子群或社区等。今天在很多领域的研究中,这一方法都被借鉴。


而20 世纪末系统科学领域出现的复杂网络理论,虽然与社会网络分析一样都是以图论为基础的,但相比社会网络分析的静态社会学研究,复杂网络理论侧重于网络动态学的研究,反映的是网络结构的演化、网络结构与网络行为的互动规律。无论是社会网络分析,还是复杂网络分析,都是对关系的数据化研究。这些研究方法,被广泛应用于虚拟空间的关系描绘与分析上。


在利用数据描绘关系的基础上,通过数据分析包括算法去揭示、发现潜在的关系正变成可能。这不仅包括大数据常常强调的各种现象之间的“相关关系”的发现,还包括其他方法对人与内容、人与人等潜在关系的发现。数据分析正在推动着新关系的建立。例如,当内容与人被打上同样的标签时,算法会将该内容推荐给对应的人。当不同的人被打上同样的数据标签时,他们之间也会被标签连接起来。


数据不仅可以显示关系的有无,还可以将关系的亲密程度、依赖程度、重视程度等过去相对模糊的属性用数据方式量化,并且公开化。例如,朋友圈、社群里的点赞数、评论数就是对关系属性的量化与公开化,人们基于数据对关系进行判断、权衡并对关系维护策略进行调整将变成常态。


在一定意义上,数据让世界的关系变得更为多元,它揭示了一些过去不明显的关系,并建构了一些过去不存在的关系。但同时,数据又使得世界的关系变得单一,它抽离了原有关系的丰富属性,使各种关系变成数据能够表现与匹配的关系。


七、评价的数据化


在人被全面数据化的同时,数据化的评价机制——“评分”也在变得普遍


今天数字空间最典型的一类评价是个体之间的相互评价。从电商卖家—买家、快递员—用户、外卖骑手—用户、网约车司机—乘客,到内容平台的创作者—消费者,相互评价制度越来越普及,而这些评价基本上都是以“打分”这样的数据化方式呈现的。


个体间的相互评分,打破了过去单一的组织评价机制,每个个体都拥有了对他人进行评分的权力,每个个体得到的评价也都来自多元的主体。评分制使得评价结果更加明朗,易于人们判断、比较。相互评分制度的盛行,还使得社会互动中人与人的相互监督与约束变得突出。社会互动的结果被量化、记录、保存,成为信任或约束的依据。在社会关系与互动日益多元、复杂的情况下,个体间的评分制可以为互动提供信任基础。


另一类评价是机构对个体的评价。今天这种评价也越来越多地落实为“评分”。管理机构用评分来进行社会治理;用人机构用评分来进行用人选择;投资机构用评分来决定资金的投放。机构对个体的评分结果不仅是对人的状态、信用、能力的评定,也是权利、利益分配的基础。


当下无论是对人还是对其他事物的评价都在日趋数据化,数字拜物教因此盛行。这也是近年来受到越来越多关注的“内卷”的本质之一。基于简单的数据统计、比较,对各种工作、业绩进行考核,其结果往往带来数量上的水涨船高,考核指标不断升级,内部竞争也由此升级。另一方面,出于种种动因,在评分上造假、作弊难以避免,而对评分权力的争夺与垄断也将成为一些机构或平台的目标。


数据化评价是控制的一种方式,既包括个体间的相互制约,也包括平台或机构对个体的控制。有研究者指出,评分机制代表了一种规则理性化的趋势,利于现有法律(及背后的公共权力)和平台私人权力的扩张和强制执行,是对流动的社会规范的进一步确认、固定化和再生产的过程。但评分权力可能会造成道德与社会规范发挥作用空间的压缩,权力的实施方式更加深入和动态化。社会信用监管者能够进入以往传统权力所无法达到的“私人”领地,将行为人的私人空间(如心理状态、行为道德等)统统纳入社会信用系统的监管之下。这也意味着权力的越界。


这种评分机制,不仅会成为机构对个体的规训方式,也会成为个体间相互规训,甚至自我规训的方式。


八、思维方式的数据化


今天人的全面数据化,不仅是因为技术的发展,其背后还有“数据主义”这样一个大背景。在数据主义者看来,数据正取代原子、实体、物质,成为世界的新“基质”。数据遍布世界,世界可以还原为数据。一切事物、人、人际关系、文化、价值都可以还原为不同算法模式下的数据。1尽管数据主义受到学者们的普遍批评,但在现实中,数据的应用仍在不断推进,渗透到社会生活的各个方面。人的数据化正是这种渗透的典型写照。


在这样的背景下,数据化思维弥散在社会环境中,人们或多或少会受到其影响。尽管数据化思维在很多方面具有独特的价值且是对人的直觉、经验性思维的补充,但仍需要足够的数据素养作支撑。而普通人的数据素养普遍不足。有的人会将具有严格规程的数据应用、思维简化为数字思维、流量思维,只看简单的数据结果,并且容易被不科学、不准确的数据迷惑、误导。


一些拥有系统的数据思维与应用能力的人,可能会过于看重数据的价值,过于强调数据、模型等的意义,从而忽视其他思维方式的作用。当下算法思维正与数据思维结伴而行,在某些方面,形成对人的思维的限制与固化。

 

作者简介:彭兰,教育部长江学者特聘教授,中国人民大学新闻学院教授,博士生导师,中国人民大学新闻与社会发展研究中心研究员。入选教育部“新世纪优秀人才支持计划”和北京中青年社科理论人才“百人工程”。兼有计算机与新闻传播学专业双重学科背景,1997年开始从事网络传播的教学与研究,对网络传播有着透彻的理解,参与过大量的网络传播实践研讨,是我国最早从事网络传播教学和研究的学者之一。先后出版《中国网络媒体的第一个十年》《网络传播学》《网络传播概论》《新媒体用户研究——节点化、媒介化、赛博格化的人》《社会化媒体》等20余部专著或教材。


本文摘自《智能与涌现》,作者:彭兰