本文来自微信公众号:腾讯研究院(ID:cyberlawrc),作者:西北偏北,头图来自:腾讯研究院
2021 年 11 月 10 日,视频网站 YouTube 宣布,曾被用于直观量化观众反馈态度的按钮——踩(Dislike),将取消公开显示计数。
换句话说,一个 YouTube 的热门视频收获了多少“赞”,不会有什么变化。但究竟被“踩”了多少次,已经成为不能外宣的秘密。如此一来,用户们迅速判断视频质量的标准习惯,就此告吹。
尽管“踩”按钮本身并未被取消,但这种很容易让人误解为“自欺欺人给不受欢迎的内容盖上遮羞布”的行为,依旧在互联网上掀起了轩然大波:
在 BBC 看来,即便 YouTube 官方宣称这项举措可以减少“点踩轰炸”的恶意行为,缓解视频制作者的压力与不适感,但可能并不会奏效。毕竟,“踩”依旧停留在视频播放窗口下方,到底有多少人不喜欢自己的视频,发布者在后台依旧能看得一清二楚。
而来自 YouTuber 的批评更加激烈:这项看似不起眼的改动,代表着 YouTube 网站彻底变质。
过去,与那些连“赞”数都要隐藏的网站相比,YouTube 理直气壮把“踩”放在互动区醒目位置,并且毫不遮掩地呈现统计数据,本来赢得不少好感。然而这份骄傲如今已经烟消云散。
于是,真正的 YouTuber 彻底被激怒了:就在官方声明公布次日,这段短片就收获了超过 5 万个“踩”。
随后,现阶段最资深的 YouTuber(没有之一)贾维德·卡里姆(Jawed Karim),重新编辑上传了自己的第一部 YouTube 视频《Me at the zoo》的内容描述,直言不讳地表达了态度观点:
《Me at the zoo》是 YouTube 的第一部视频,而且贾维德·卡里姆最知名的身份便是 YouTube 的联合创始人,这段视频内容描述的影响力丝毫不比 YouTube 官方公告逊色。再加上这部视频高达 1000 万的点赞,YouTuber 的态度更是不言自明。
尽管遭受了近乎一边倒的反对,但从 YouTube 官方表态来看,“隐藏点踩数量”俨然属于志在必得的改进。时至今日,“踩”的数量已经被正式隐藏。
问题在于,究竟是什么理由让 YouTube 如此执拗?又是什么理由让它直接选择了对“踩”进行一刀切?饱受争议的“踩”,到底又有什么实际意义?
自食苦果的 YouTube
可以说,对于 UGC 内容社区来说,“踩”这种明确象征反对姿态、高效传递负面情绪的互动功能,无论如何都属于必须谨慎对待的敏感设计。
YouTube 官方也曾多次自食其果。2018 年末,数以百万计的 YouTuber 齐心协力,用整齐划一的“踩”,一鼓作气将 YouTube 官方的年度回顾视频《YouTube Rewind 2018: Everyone Controls Rewind》,挂上了“YouTube 有史以来最不受欢迎视频”耻辱柱的柱顶。
在 YouTuber 看来,《YouTube Rewind 2018: Everyone Controls Rewind》是一部充斥着陈年烂梗、主观臆断、避重就轻顾左右而言他,外加无视社区民意的大型“灾难纪录片”,属于 YouTube 有史以来最糟糕的年度回顾。
用户情绪一旦激化起来,再多的辩解都是徒劳无功。仅仅一周时间,这部短片就成功超越了贾斯汀·比伯《Baby》的 MV,成为载入吉尼斯世界纪录的 YouTube 头号差评视频,并且一直保持到了 YouTube 正式隐藏点踩计数的那一刻。
凭借近 2000 万的“踩”、高达 86.77% 的 Dislike 比率,《YouTube Rewind 2018: Everyone Controls Rewind》以不可动摇的恶评冠军姿态,成为了鲜活呈现 YouTube 社区负面氛围,以及 YouTuber 消极情绪输出的切片样本。
面对铺天盖地的“踩”和嘲笑,YouTube 自然不敢怠慢。没过多久,在官方声明中,YouTube 坦诚地表达了态度:
在‘踩’的数量排行榜上击败《Baby》,并不是我们的年度目标;诚实的反馈确实有可能很糟糕,但我们一直在倾听,始终在感谢用户的关注;试图利用一部视频归纳 YouTube 的平台魅力,无异于尝试用莱顿瓶捕捉闪电——我们再次体验到了内容创作的困难程度,也进一步提醒我们要对 YouTube 创作者保持尊重。
然而,这种“尊重”究竟如何实现,确实让人大吃一惊。2019 年 1 月 30 日,在 Creator Insider(一个分享 YouTube 技术团队内幕消息的频道)发布的一期视频当中,YouTube 项目管理总监 Tom Leung,介绍了两套“保持尊重”的方案:
其一,当观看者点下“踩”的时候,必须通过复选框提交不喜欢当前视频的原因,从而向创作者反馈更详尽的整改建议;除此之外,这种多点一步的操作,也能让不假思索点踩的观众适当减少一点冲动,有效降低“踩”的情绪化色彩;
其二,彻底取消“踩”这个功能——简单粗暴,但效果如何另当别论。
尽管 Tom Leung 一再强调这些方案“仅仅处于内部探讨阶段”,但在消息公布之后,立刻引发轩然大波。
其实,如果回顾 YouTube 评论互动系统的发展史,会发现早在 11 年前,YouTube 就对平台的内容评价功能,展开过一次彻底的修改:
如今广受好评的“赞”和“踩”功能,正式上线于 2010 年年初,在此之前,YouTube 采用的是类似亚马逊的五星评价系统。
至于 YouTube 为何要做这种一刀切式的修改,官方博客的一张图做出了解释:
乍看之下,五星系统意味着颗粒度更小的评论反馈,但根据 YouTube 官方的统计,这套系统收获的大部分评分都是最高的五星,然后是完全不成比例的一星,至于二三四星这些“中间态”,几乎无人问津。
“如果大多数视频收获的都是五颗星,那么这套评价系统到底还有什么意义?竖起/向下的大拇指或许会更有效,或者直接用“喜欢”来表示内容的赞同会更好?这些都是我们在查看统计数据,思考应该如何提升平台体验的时候,向自己提出的问题。”
这是在 2009 年的时候,YouTube 通过官方博文《Five Stars Dominate Ratings》提出的诘问。如今看来,至少对于 YouTuber 来说,公开显示点踩/点赞数据的设计,确实曾经深得人心。但从平台方的立场出发,这套方案真的是最优解吗?
横遭滥用的表决权
如果我给一个视频点了“踩”,接下来会发生什么?
在目前 YouTuber 们所有的困惑中,这个问题绝对有资格排进前三甲——甚至还有 PewDiePie 这种搞怪视频主专门推出 Vlog《Can this video get 1 million dislikes?》来哗众取宠,结果收获了将近 600 万“踩”,
对于普通视频创作者来说,“踩”真的仅仅意味着情绪发泄,不代表任何负面效果吗?
首先可以明确一点,“赞”和“踩”的次数,确实能够对推荐算法的判断造成影响。在 YouTube Creater 频道的官方视频《“算法”-了解 YouTube 的搜索和发现系统的运作方式》当中,可以清楚地看到这种结论:
我们的算法会尽可能在适当的时间向全球范围内合适的观看者显示恰当的视频,怎么做到这一点呢?依靠的就是数据——我们会了解每个视频的标题、缩略图和描述,以及其它观看者对视频的喜爱程度;我们还会了解观看者看了视频的多少内容,评论的人数,以及“赞”和“踩”的次数。
即便如此,想要精确量化单独的“踩”会对视频产生多大影响,依旧十分困难:
根据谷歌在 2019 推荐系统大会(RecSys 2019)上公布的论文显示,上文中提到的诸多参数,会被划分为“参与度(例如观看次数和观看时间)”和“满意度(包括点赞数和点踩数等等)”,然后利用宽度模型和深度神经网络对每一个“恰当的视频”基于参数生成预测,再叠加单独的排序模型进行推荐。
但在大多数局外人看来,YouTube 的推荐算法基本等同于黑箱,想要精确掌握上传视频的播放参数对推荐量的影响,几乎是不可能的。
就算无法破解完整的模型和算法,利用穷举法对有可能影响 YouTube 推荐排名的参数进行权重估算,依旧是可以实现的。2018 年,briggsby.com 的研究者 Justin Briggs,从 75000 个 YouTube 频道的 100000 个视频当中,抓取了 380 万个数据点进行分析,最终结果如下:
可见“踩”的数量对于 YouTube 内容的影响权重,虽然远不及视频观看次数和点赞数,至少在所有参数中也足以占据中游。
不过,影响权重仅仅是一方面,影响力究竟是好是坏才是关键。回到开头的问题:在不可忽视的权重影响下,收获大量的“踩”对于 YouTuber 的视频来说,到底意味着什么?
很明显,这个问题触及到了 YouTube 内容产业的敏感区域,很难指望通过正规媒体找到答案。不过,我们依旧可以通过从事相关产业的“专业团队”口径,窥探到一点值得思考的结论:
重点在于,YouTube 历史上从来没有任何视频获得过 100% 的正面反馈;即使是最受欢迎的视频,也会因各种原因收获一堆“踩”。如果一个视频拥有成千上万个“赞”而没有收获半个“踩”,警报会响起,YouTube 完全有能力察觉这类异状,进而采取相应的行动。因此,如果您曾经给 YouTube 视频购买过“赞”,那就还需要购买相应的“踩”;这是在正负交互反馈之间取得平衡,让整场交易看起来没有异状的必经手续。
上文是老牌社交网络刷量供应商 MediaMister,对于“为什么要购买 YouTube 点踩”做出的解释;相比之下,圈内资格更老的 InstaFollowers,给出的答案要露骨得多:
考虑到“踩”是一种攸关内容推荐排名的权重指标,并且能够向 YouTube 传达“品质不佳”的印象,您可以购买“踩”来破坏竞争对手的内容推荐效果。至于数量,如果您购买“踩”的目的在于平衡“赞”的数量,那么 10% 是个不错的比例;但是,如果您为了遏制竞争对手而购买,那么大可把“见好就收”抛在脑后。
考虑到这两家企业都有十年左右的经营资历(MediaMister 成立于2012年,InstaFollowers 则在 2010 年上线)且时至今日依旧没有终止营业,作为久经市场考验的资深灰产专业团队,这番说辞自然不乏可信度。
除此之外,业务水平过于突出结果引来监管机构强行取缔的“后起之秀” Devumi,更是从专业团伙的立场出发,直言不讳地挑明了“刷量”这门生意的本质:
社会认同是一种着眼于群体行为心理学概念。它包含的基本理论,就是当你看到有足够多的人去做某些事时,你也会跟风来做。例如,你看到很多人在网上谈论新电影,你会有意愿也去一探究竟——这项理论同样适用于 YouTube。
刷量带来的仅仅是一个提升社会认同度的数字。您购买这些数字的目的,是为了让那些真正的观众更积极地观看、评论并分享您的视频作品。
给播放数和点赞数刷量,可以带动真人观众主动观看并留下“赞”,反之亦然——给“踩”刷量,同样可以引诱真人观众跟风点踩,这就是来自“专业人士”的解释。“踩”对于现如今的 YouTuber 究竟意味着什么,结果已经昭然若是。
那么,既然“踩”的表态意味早已被灰产供应商玷污,不容小觑的推荐权重负面影响,更让这种功能变成了人身攻击乃至进行互联网霸凌的有效武器,YouTube 为什么没有像 2019 年预告的那样,删除“踩”功能来一劳永逸地解决后顾之忧?
YouTube 的改变
不难想象,和已经变质的“踩”一样,在某些无关精准度的商业要素影响下,YouTube 算法推荐系统的实际运作效果,并没有那么理想化。
根据《纽约时报》在 2018 年的报道,前谷歌算法工程师 Guillaume Chaslot 声称,为了提升平台粘性和用户留存率,从很早之前开始,YouTube 就倾向于通过算法向用户推荐观点激进的视频内容。Chaslot 表示,正是由于他对这种平台策略“感到震惊”,才会在 2013 年被 YouTube 扫地出门。
根据 Chaslot 随后进行的调查研究,在很长的一段时间内(至少持续到 2016 年),对于内容导向愈发激进的推荐系统,YouTube 并没有表现出明显的调整意愿——在 Chaslot 的力争下,以《华盛顿邮报》为代表的传统媒体最终认同了这个观点,“YouTuber 正在被缺乏节制的内容推荐系统引入歧途”。
尽管并未正面否认相关结论,但在近几年的时间中,YouTube 确实做出过一系列调整。围绕“踩”展开的调整,仅仅是其中显眼但并非核心的一环,看不到的算法模型修改才是重头戏:
根据 Google 官方的介绍,凭借不断优化的算法和持续调整的参数权重,目前, YouTube 已经可以自动检测并标记 94% 的违规内容,75% 的违规内容在观看量达到 10 之前就会被删除;截至 2020 年 Q4,代表平台内容净度的 VVR(Violative View Rate,违规内容观看率)已经降到了 0.16~0.18%,意味着每 10000 次用户观看行为,只会有 16~18 次点开令人反感的内容;与 2017 年的同季度数据相比,下降了 70% 以上。
平台内容的净化,意味着激进内容的减少。然而,只要那些无视内容、纯粹带节奏的刷“踩”业务依旧存在,那么指望用户群体找回理性、让“踩”真实反映自身态度就注定是缘木求鱼。
同样,平台用户多年养成的行为习惯显然不可能轻易改变,直接把“踩”彻底删除势必会引起巨大的反感,那么退而求其次,保留功能但隐藏计数,从根本上阻断跟风刷“踩”的环境条件,似乎就变成并非完美,但确实合理的有效方案。
从目前各方面的反馈来看,YouTube 这种明显不乏斟酌的调整策略,并没有取得用户的认同:在很多 YouTuber 看来,仅仅保留“踩”的功能而取消“踩”的计数,意味着从此无法清晰辨认点开视频的实际质量——那么,到底有没有一种方案,既能直观显示“踩”的数量,又能准确反映“踩”到底是被带节奏的跟风,还是真实的情绪输出?
一个例子来自 Steam:
为了应对日益增长的恶意差评行为,2017 年 Q3,数字游戏平台 Steam 对用户评价互动系统做出了引人瞩目的调整:除了继续显示互动点评数量,并通过百分比和从“好评如潮”到“差评如潮”在内的 9 个档位来直观呈现内容品质之外,玩家提交的“好评”和“差评”,从此可以通过时间轴清晰地呈现出来,通过简单的点选,就能直接跳转显示特定时间点的“差评”玩家评论。
由此一来,Steam 玩家很容易就能考察存在争议的内容到底是素质使然,还是刻意有人带节奏,不仅做到了下单之前心里有数,更是有效降低了跟风差评的概率。
那么,这种既可以保障互动透明度,又能够真正实现言责自负理想目标的系统,有没有可能在 YouTube 上实现呢?答案并没有那么乐观:
尽管凭借 1.2 亿的月活量(2021 年统计数据)雄踞数字游戏平台行业榜首,但和月活跃用户数超过 20 亿(同为 2021 年统计数据)的 YouTube 相比,Steam 的体量和流行程度还是差太远了。再考虑到两者内容生态以及消费模式的巨大差别,用户评价以及互动系统无法沿用,纯属预料之中。
不仅如此,时至今日,62% 的互联网企业已经将 YouTube 视作宣发的必备渠道,平台用户每天的观看时长都在 10 亿小时以上;由此一来,就像传统电视频道衍生出的一系列相关产业一样,围绕 YouTube 同样涌现出无数周边产业——那么,我们不妨猜猜看,除了正规合法的营销服务,那些仰赖 YouTube 谋生的“专业团队”,又有多少处于灰色乃至黑色地带?
在 Google 上输入“YouTube Bots(按照指令自动互动的机器人程序,操作包括但原不仅限于刷“踩”和刷“赞”)”,从第一页开始,整整十页的返回结果几乎都是相关广告,正视这个现象展开调查的媒体报道几乎没有。
说到底,YouTube 衍生产业所包含的“非真实”成分究竟是“房间里的大象”还是“车库里的龙”,所有人都心知肚明,但所有人都不愿意点破:因为所有人都清楚,揭露这个真相的后果,很可能超过了这家网站、整个行业乃至 Web2.0 的承载上限——毕竟,戳穿泡沫对于互联网来说意味着什么,20 年前就有整整有一代人见证过。
当我们找不出最完美的方案来解决问题的时候,最不坏的答案,恐怕就是我们必须接受的最优解——对于 YouTube 来说,也同样是目前唯一的版本答案。
不无遗憾。但或许,这也是并不完美的 Web2.0,留给时代的必然。
本文来自微信公众号:腾讯研究院(ID:cyberlawrc),作者:西北偏北