科学家联手揭示网红诞生的关键因素

最近几年，社交平台的涌现与飞速发展，使得我们获取内容的方式发生了天翻地覆的变化，同时也造就了一批又一批在网络上具有影响力的人，或者说，“网红”。这些网络红人是如何诞生的？对于这个问题，你的脑海里可能已经浮现出了一些案例。但对于科学家来说，要系统性地解答这个问题并不容易，因为我们对于网络社交平台的理解还非常有限。

最近，在一项发表于《自然·通讯》的研究中，北京大学与瑞士苏黎世联邦理工大学领导的研究团队合作，通过数学模型揭示了“网红”崛起之路。

当我们对比今天与十余年前的社交平台，会发现如今主流的社交网络有一个明显的特点：用户的内容获取不再建立在互加好友的基础上，现在众多社交平台的核心是用户生产的内容（User-Generated Content）。以Twitter为例，每天用户会生产5亿条Twitter内容。而话题标签和平台内部的搜索引擎使得用户可以按照自己的兴趣搜索内容、构建基于自身兴趣的社群。同时，在这个网络中，一些用户迅速取得了巨大的影响力，成为“网红”。

基于这样的模式，我们在探究“网红”崛起之路时，需要理解两个问题：用户生产的内容与快速成长的“网红”之间有着怎样的关联？由此产生的社交网络有哪些特征？

一个直观的影响因素是内容质量：更高质量的内容显然更有机会吸引其他用户的关注。当然，要建立社交网络的动态模型，只考虑这一个因素显然不够。但遗憾的是，众多已有的数学模型在这个问题上都不适用。

因此，研究团队结合了现代社交平台的特点和既有模型，提出了一个预测社交网络形成的简单数学模型。在这个模型中，内容质量是主要影响因素，此外作者也考虑了用户的功利主义原则。用户会根据自己的兴趣，基于内容质量决定关注与否。

在一个由6000多名科学家组成的网络中，研究团队针对Twitter数据测试了他们的模型，从而获得了网络形成的动态过程。

结果表明，这些用户想要提高自己接收的内容的质量，因此他们会持续搜索优质内容提供者，从而形成自己的社交平台网络。在这个过程中，他们会重点评判内容与自身兴趣的一致性、内容同质性，以及质量有多高。

此外，研究团队还利用这个模型分析了最终的平衡状态。

从这个网络的入度分布，也就是与某个节点（内容生产者）相连的其他节点（关注者）的数量中，他们发现了一个特别的模式：生产最高质量内容的用户的粉丝数量，是第二名的两倍、第三名的三倍，以此类推……这个规律符合齐夫定律（Zipf’s law）。值得一提的是，根据初步预测结果，当模型模拟真实世界的推荐算法，即根据用户的喜好进行推荐时，这个结果依然牢固。

从这个模型中，研究者还发现，模拟产生的网络特征与真实世界的相似，例如存在较小的聚集系数。这个网络的出度分布，或者说是其中的用户关注他人的情况，则接近伽马分布。

随后，研究者还利用真实社交平台的数据验证了这个模型。他们选取的是一个名为Twitch的在线游戏玩家平台。验证结果显示，这个模型在模拟社交网络的形成情况时，比以往的模型更加贴近实际。

作者指出，尽管这个模型较为简单，但它已经为我们揭示了当今基于用户生产内容的社交网络的宏观特征。也正是因为简单，这个模型还能向不同方向拓展，探索不同条件下的网络形成过程。

未来的研究将进一步探究，在不同的平台、不同的算法机制之下，“网红”诞生之路以及用户在社交平台中的表现又是怎样的。这些研究不足以保证你成为“网红”，但它为“网红”的形成机制提出了见解，并且再一次提醒我们：内容才是王道。