本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:郭瑞东,审校:赵雨亭,编辑:邓一雪,原文标题:《成功的故事都是相似的:叙事套路的量化研究》,头图来自:视觉中国
不论是电影、电视剧还是科研论文,都可以将其看成是一组叙事。然而总会有些叙事更加成功。6月29日,一篇刊载于 PNAS 的论文“如何量化故事的形态可预期其成功”,通过自然语言处理,分析了电影、电视剧及科研论文的叙事模式,与其成功间的关系。发现不同类型的文章,由于大众的认知偏好,促成其成功的叙事模式不同。作为计算社会学的一部分,该研究通过量化分析,确认了面对不同的叙事模式,存在普遍的认知偏好。
一、自然语言处理:对文本降维后可认知的社会观念
语言在传播过程中,如果一些词汇总是一同出现,可认为这一现象反映了社会的普遍认知,比如女性是柔弱的、需要被男性拯救的。“童话里都是骗人的?用词向量解析故事中的性别偏见”这一推文,就讨论了这一问题。故事中男女相遇时,女性的情绪相比男性会变得更加积极,但事实真的是这样?更有可能的解释是:描摹女性角色情感脆弱的影视故事会获得更多的观众。
使用词向量,对性别和种族成见进行分析的论文,近年来还有很多,例如[1]指出了这种方法的局限:词向量中的“男生和程序员,女生和做家务”的联系,反映的是词汇间的相似性,而非社会偏见。而[2]则指出,一个量化衡量搜索引擎的排序算法是如何加深了性别成见的方法。
除了具体的情绪,这类研究还能搞清楚叙事中的情绪和叙事成功的关系。一些文化产品(如书籍和电影)流行起来,而另一些则失败了。为什么?今年的一项研究[3]认为,情绪在不同时期的转变,会提高观看者的参与度。
通过对超过4000部电影的自动情绪分析表明,情节反转更多的电影会得到更积极的评价,在评价更容易受到刺激影响的电影类型中,这种效果更强(例如,惊悚片而非浪漫片)。此外,对超过30000篇在线文章的分析表明,人们更有可能继续阅读情绪不稳定的文章。通过在后续实验中操纵情绪波动,该文强调了情绪波动对评价的影响是因果性的。
二、叙事模式而非具体的情感带来的影响
用词向量解析故事中的性别偏见中的研究,先是考察海量文本的平均状况,而[3]则是考察每篇叙事的单独影响。然而这些研究考察的,都是相对直观的情感和认知偏差。读者会表示有的文章叙事节奏快,有的文章旁征博引,还有的文章出人意表,这些与特定情感无关的叙事模式,如何影响文章的成功,是该文详细介绍的 PNAS 论文要回答的问题。
该研究将电影、电视剧和学术论文的文本分为长度相近的段落,然后使用词向量,将其映射到高维语义空间,每个段落看成高维空间中的一个点,点的位置代表这一段的主题。之后审查不同段落之间的路径。从中得出第一个指标是行文的速度,即在同一段落间、词汇之间的跳跃是否剧烈,词与词之间的变化是否迅速。
常识告诉读者,对于难度较大的文本,例如教科书,其叙事的节奏要慢一些,段落间的语义相似度也会低一些,这样便于理解。而对于娱乐性的电视剧电影,叙事速度快一些会带来更多的兴奋感。叙事速度可能与成功有正面或负面的关系,这取决于具体情况。
第二个指标上叙事的覆盖度,如果两个相邻段落描述的概念在语义上差异不大,那么该文本的覆盖度就相对低。具体定义是通过求解一个包含所有这些点的最小体积椭球体的最佳化问题,用椭球体逼近点{ x1,x2......xT }来测量椭圆的体积,将其称为叙事的覆盖度。如图1所示:
第三个指标是探索每个段落在语义空间中是如何被连接的,通过求解旅行商问题,可找出连通这些点的最短路径。比较真实路径和最短路径,就可以量化一段叙事是否曲折。在某些场景下,迂回的故事能够让读者通过对不同话题出人意表的探索,建立更深层次的连接,因此也可能使叙事更有吸引力。
笔者认为:该文的研究方法,更多地依赖词向量,以及通过等长文字(125或325词)的词向量平均得出的段落主题,来定义上述三种指标。本项研究并没有考虑句子层面的逻辑关系,如果能够对句子的长度和类型,句子中不同词性的单词分别加以分析,通过知识网络,整合更多特征,将能够对叙事模式的更多维度给出更清楚和准确的定义。
通过对4000部电影和12000集电视剧进行分析,研究人员发现,叙事节奏快的电影和电视剧更受欢迎,对于电视剧,其覆盖的主题相对较少时更受欢迎,这可能来自观众对不同媒介的娱乐有不同的预期:看电影时观众想从中获得更深的感动或震撼,而电视剧则被当成了快餐式的消遣,因此涉及主题过多的电视剧不受欢迎。
而对来自22个期刊的29000篇论文分析的结论则展现了不同的模式,首先是那些叙事节奏快的论文,被引用的次数少;其次,不同段落涵盖的知识面多的论文,被引用的次数更多。更有趣的是,正如循环式地在多个概念间切换,能够提升学习效果,对于那些迂回程度高的论文,由于这样的叙事模式能够帮读者更好的理解,因此其引用更多。
传统观念认为是大众文化塑造了个体层面的心理过程,但该研究指出,当存在集体相似性的时候,个体的审美偏好,也会影响社会层面呈现的文化产品。虽然难以对个体进行测量,或通过实验确定因果联系的存在,但假设大部分人渴望刺激或惊喜,喜好相对高一些认知复杂性的电影,而在看电视剧时偏好处理得简单化,通过将新想法与之前探讨过的主题联系起来,以提高记忆力,能够对该文的结果给出合理的解释。上述的语义推进的模式也可能影响政治演讲或法律论据的说服力。
该研究指出,文化产品的成功,并不是随机的。通过合适的工具,可以提取文化产品中的叙事特征,并对其成败加以解释。该研究还说明自然语言处理可以帮助语言学家、社会学家和哲学家开展量化研究,开辟新的研究方向。
后续,研究人员可以针对的不同类型的叙事的特点(叙述与阐明)、目标(娱乐与传授知识)、情态(视频与书面)、结果测量(喜欢与引用),继而研究清楚上述不同的偏好的根源。此外,还可以研究其他类型的叙事(例如书籍、演讲、授课、纪录片或科普文章)。同时该研究没有考虑情绪变化及高潮冲突对叙事的影响
类似的指标也可适用于个人对自身生活的叙事。人们经常用故事来解释和理解自己的生活。正如有创造力的人在他们的思想之间有更多的跳跃(即较少的语义联系)。个人叙事中的语义进展可以洞察作者的个性,甚至解释叙事这一行为是如何影响幸福感的。
三、从媒体到个体到场景:基于用词习惯的计算社会学研究的方向
根据对一段时间内,报纸电视中出现的文本的分析,能够看出哪些词汇流行、目前对性别或种族的偏见在加强还是减弱、整个社会对某一行业的看法是乐观还是悲观,甚至可以据此判断股票的涨跌。进一步的研究中,可以将单篇文本当成一个数据点,去判断文本的情感表述或叙事模式如何影响文本的流行与否,并从中找出社会普遍的审美/认知偏好。
然而叙事本身的成功,和叙事对社会的价值并不总是等价的。一个成功的娱乐节目,其传播的信息,可能是反科学的假信息,这无疑是令科普工作者痛惜的。然而好的科普,都是以故事的形式才得以广为传播的,如何找到科普文章合适的叙事模式,是一个有实际意义的问题。
对于该问题,PNAS今年6月的评论长文“关于科学中的假消息的叙事真相”一文,值得细读。该文指出,科学和讲故事的逻辑有本质不同,科学的标准是看其能否和真实世界相符,而叙事的评价取决于其描述的状态是否栩栩如生,这使得相比科研叙事,讲故事往往具有超乎寻常的影响力,这对科普来说,同时是福也是祸。然而讲故事的叙事模式,可以被调整地适合科普,从而使听众在潜移默化中改变自身的看法和思维习惯。
上述的研究可以应用于这样的场景:若是基于微信上的科普文找到了最适合不同话题、面向不同人群的科普文叙事模式,那么就可以开发工具,指导未来的科普文写作。例如告诉写作者这篇文章太过枯燥了,需要多加一些背景描述,或者该文的概念跨度太大,需要多一些铺垫等。
除了将每篇文本作为一个数据点,另一个方向是将个人在社交媒体上的发言作为一个数据点,通过分析不同性格/文化背景/思维习惯的人在遣词造句上呈现出的模式,考察一个人的语言风格和其个人情感生活/职业生涯成功间的关系,也可以去探究人际交往对语言风格的影响、青春期成长不同阶段的轨迹变化等这些个体层面的特征。最终会经由人与人的互作,涌现社会层面的影响,而这才是自然语言处理+计算社会学的下一步研究方向。
而这样的研究,最终的成果,将成为守护人们心智的“精准医学”:如果有一个App,能够根据用户的用词习惯,告诉TA其实思维中对女性歧视,也许该用户会有动力去改进;或者告诉人们最近的幸福得分降低,是由于用词习惯中抱怨太多引起,它们也许能够针对性去改进提升幸福感。
参考资料:
1. Robustness and Reliability of Gender Bias Assessment in Word Embeddings: The Role of Base Pairs
2. Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by Ranking Algorithms
3. The narrative truth about scientific misinformation
本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:郭瑞东,审校:赵雨亭,编辑:邓一雪,论文题目:How quantifying the shape of stories predicts their success;论文地址:https://www.pnas.org/content/118/26/e2011695118。