几日不见,我们的老朋友谷歌又双叒叕摊上事了——

一名网站搜索引擎优化工作的从业者,向市场和受众研究公司 SparkToko 透露,他拿到了一份超过 2500 页的谷歌内部接口( API )开发文档,这份 API 文档里记录的信息,能够证明谷歌之前对自家搜索引擎的一些描述,是在撒谎。



这名爆料者希望谷歌能够解释一下,为什么谷歌以前的宣传和这份文档里写的东西差那么多。

本着有热闹不看白不看的精神,我特地去做了下功课,了解下谷歌这次的塌房到底怎么回事。

目前完整的 2500 页泄露文档负责爆料的 SparkToto 还在找人分析,但是他给我们 “ 超前点播 ” 了其中 5 个谷歌谷歌的 “ 谎言 ” 。

我完整看完之后只想说:就这点事,哥们你有啥好骗大家的?



我挑一两件给大家解释一下,大家就懂为什么我会有这样的感觉了。

我们先看个名字最短的——点击导向排名机制。

光说名字,大家估计都能猜到他是干什么的了。其实就是搜索引擎根据用户点击行为,动态地给搜索结果排序。

但有一点可能要澄清一下,这个机制不仅仅考虑搜索结果的点击次数( 也就是点击量 ),还会涉及用户点进搜索结果之后的行为,包括跳出率、停留时时长等等。

比如托尼深夜搜索了一个科学小问题,翻到了搜索结果的第二十页,找到了充满各种彩色横幅小广告的网页,并且在里面停留了十几分钟才一脸疲惫地离开。

我是说搜索霓虹灯灯的发光原理,想歪的自己检讨



如果恰好有好几个网友跟托尼进行了同样的操作,那搜索引擎就会认为这个结果对用户来说是有用的,后面再有人搜索同一个问题的时候,浏览器就会把这个充满彩色小横幅的结果往前挪。

然而——铛铛铛!2017 年的时候,谷歌搜索关系团队( Search Relations team )的负责人 John Mueller 在一次采访中说,谷歌没有直接在搜索排名算法中使用点击量数据和用户行为数据。

这不,被这次泄露的文档啪啪打脸。



但其实,严格来讲这个操作不见得是什么坏事,只能说是有利有弊。

虽说新发布的高质量内容可能因为没人点被排到后面去,也容易让那些恶意刷点击量和留存时间的网页污染搜索结果。

但是站体验的角度来说,依赖点击和停留时长的排序机制,能够帮助用户更快速地找到他们感兴趣的信息,毕竟大部分人会点进去长时间看的内容,很有可能也是我喜欢的。

谷歌自己也能靠这个机制动态调整搜索结果排名,让热门和时事内容更快出现在前排。

既然事情本身有好有坏,那为啥谷歌死活不肯承认自己做过呢,这就不得而知了。

可能是担心外国用户们过于注重自己的隐私吧。

文档里披露的另外一个秘密就是,谷歌会在某些领域执行白名单机制,把它认为值得信任的内容放在更靠前更显眼的地方。

发现这件事情的过程也有点意思,负责分析这次泄露的文档的工作人员发现,文档里提到了一个叫做优质旅游网站的模块。



这说明谷歌在旅游领域确实搞了一个白名单,把它认为值得推荐的旅游相关内容放到白名单里,用户在搜索的时候优先推白名单里的内容。

目前还不知道谷歌有没有在别的领域也搞白名单。但也不能直接下结论,说谷歌在拿这个白名单机制干坏事,因为白名单机制本身是有一定积极意义的。

SparkToko 就在爆料中提到, 2020 年某位美国总统候选人鼓励追随者冲击国会山的时候,谷歌的这个白名单机制就发挥了正向作用。

如果没有这个机制,搜索引擎很有可能就会给用户推没有经过核实的报道,没准会直接导致更多的争论、暴力。

但是,谷歌一直不愿意公开承认自己搞名单,反而让人不放心——你现在是用它干了些正事,但谁知道你会不会用它动什么坏心思。

还不如一开始就大大方方承认用了,并且老老实实交代自己是怎么用的。这样还省得现在被锤了显得尴尬。

SparkToro 还分享的其他几件事,包括使用 Chrome 浏览器的点击流来驱动 Google 搜索、采用人工评估网站质量、在排名算法中使用用户交互数据。



这些事情本身有好有坏,真做了对普通用户而言也说不上是很严重的危害。但是谷歌就是死活都不肯承认,最后还要被人打脸。

一直以来,谷歌都有被指责吹牛、立人设、言行不一致,这样的新闻真的不算什么新鲜事了。就连曝光这个事情的 SparkToko ,都在报道里总结了这个现象——谷歌似乎总在 “ 被塌房 ” 。



一两次还好,多了不光有损谷歌自己的形象,也会让公众越来越不信任搜索引擎。

所以,谷歌,咱要不还是实诚点,干了啥先承认呗。大不了多弹几份隐私协议,多让用户点几次 “ 我同意 ” 。

反正这么多年点下来,大家都已经麻木了。