过去几年,我一直在做互联网社区方面的工作,自以为做了很多,也积累了一些经验,自然而然也就“相信很多东西,不相信很多,以为已知的就是一切了”。这些“相信”可能也不特别,仅仅因为我不知道更多的东西,才认为有意义。即便如此,时不时还是有冲动,想把这些思考记录下来。


最近这段时间,各种机缘巧合,和从事社区产品工作和想要从事社区产品工作的朋友,以及不确定是否要做社区的同行交流了很多,发现大家对于互联网社区,思考的问题和存在的困惑大同小异相差无几。在再一次重复了某些一再重复的观点之后,我决定写下这篇文章。


这篇文章记录的是我个人过去几年时间,关于互联网社区的思考与理解,虽然内容已经尽可能的精简与概括,但还是稍显繁杂。


本文来自微信公众号:黑坝(ID:HolylandofKalin),作者:许昕,原文标题:《互联网社区产品方法论》,头图来自:视觉中国


一、什么是互联网社区?


1. 互联网社区定义


中文“社区”一词,由英文单词“Community”翻译而来。“Community”源于拉丁语“Cīvitās”,意为团体、共有。社会学意义上,社区一般被解释为生活在同一地理区域内、具有共同意识和共同利益的社会群体及其活动区域。


互联网语境下,社区“同一地理区域内”的特点被弱化,“具有共同意识和共同利益”的特征也演变为“具有相同兴趣、文化偏好和价值观”,并更为凸显。由此,本文将互联网社区的定义概括为:聚集了具有相同兴趣、文化偏好和价值观的社会群体的网络交流空间。


(“社区”一词,由《乡土中国》的作者费孝通翻译而来,沿用至今。《乡土中国》也是社区产品经理的必读书籍)<br>
(“社区”一词,由《乡土中国》的作者费孝通翻译而来,沿用至今。《乡土中国》也是社区产品经理的必读书籍)


2. 互联网社区分类


互联网社区就像一个筐,什么都可以往里装,装了游戏是游戏社区,装了短视频是短视频社区,装了“你刚编的故事”,就是......因此,在对社区进行分类时,也不存在单一排他的方法。


例如,从内容形式的角度,可以将社区分为图片社区(Instagram)、视频社区(B站)、直播社区(快手)等;按产品形态,又可分为论坛(猫扑)、微博(饭否)、问答(知乎)等;根据覆盖范围的不同,还可将社区划分为垂直社区和综合社区。


垂直社区是指面向某一特定领域,或者聚合特定主题的社区,如足球社区直播吧,电影社区时光网。综合社区则不针对特定领域或主题,所有可被冠以“国民性”称谓的社区产品,都可以纳入到综合社区的范畴,如微博、抖音。


同一分类下,不同社区之间的界限并不严格划分,而是相互交织各有偏胜,如Instagram,早期定位为图片分享社区,但后期也增加了Story这种短视频内容。


(左起:B站、微博、知乎)<br>
(左起:B站、微博、知乎)


本文主要从垂直社区和综合社区的分类角度,对社区进行分析。之所以如此选择,主要为了方便对获客和增长、破圈和转型这两个如同“互联网社区年度关键词”的问题进行论述。


①获客和增长。社区从诞生、萌芽、到成长、成熟,自始至终会面临获客与增长的问题。社区设计者首先应明确社区所属垂类,然后从行业角度,计算出社区的容量,也即社区获客和增长的天花板,之后才是社区定位、架构设计以及对任务的拆解、落地。


以股票垂直社区为例,中证登数据显示,截至2020年11月,中国投资账户总数为1.76亿,这个数字约等于中国证券投资者数量。那是否可以将这个数字理解为股票社区用户数的天花板?答案是否定的。虽然现存投资账户是1.76亿,但其中包含了很多因各种原因(本质上就一个原因——亏损)不再交易的僵尸账户,而我们需要明确的是活跃投资者的数量。


虽然2017年2月份以来,中证登就不再更新活跃账户的数据,但根据过往统计数据推算,活跃账户占总账户的比例基本维持在(10%~40%)这一区间,2020年股市行情见仁见智,活跃账户比例如果取中位数25%,并对活跃账户数进行计算,数值落在4403万,这个数字才是现阶段股票社区用户数的天花板。


新兴的股票社区可以在这个数字基础上,制定更为合理的短、中、长期增长目标。对于成熟股票社区来说,如果社区本身的活跃用户数已经接近行业天花板,那么在原有框架内,不管怎么折腾,也很难有大的突破。这个时候,社区设计者自然而然要去思考破圈和转型的问题。


(中国投资总账户数和活跃账户数。数据来源:中国证券登记结算有限责任公司网站;数据区间:2015年5月8日-2020年11月30日)<br>
(中国投资总账户数和活跃账户数。数据来源:中国证券登记结算有限责任公司网站;数据区间:2015年5月8日-2020年11月30日)


②破圈和转型。对于绝大多数存活下来的垂直社区来说,天花板并非遥不可及,如果目标是持续增长,或早或晚,都会面临破圈问题。破圈/出圈,是饭圈用语,意为某个明星或某个作品突破固定粉丝圈层,在更大范围内为人所知。例如五条人,一支来自广东海丰的歌曲多用海丰方言演唱的小众乐队,因为在综艺比赛中屡次被淘汰,又屡次被捞回而破圈。


(五条人)<br label=图片备注 class=text-img-note>
(五条人)


垂直社区的破圈,本质上是立足垂直领域,向与其相关的综合方向发展。最近一段时间,与“破圈”一词最常结伴出现的,应该就是B站了。早期,B站是一个纯粹的ACG(动画、漫画、游戏)社区,以弹幕、鬼畜文化为特色,核心用户是二次元爱好者。


现在的B站,已然破圈——B站跨年晚会、后浪视频、自制综艺及剧集(《说唱新世代》、《风犬少年的天空》)等内容,顺带B站,已经打破了原有的二次元圈层,为大众所了解。但早在这些官方自制内容出圈之前,B站就已经开始转舵。


2018年7月,哔哩哔哩COO李旎就表示:“B站目前汇集了7000多个垂直兴趣圈层,传统意义上的二次元内容,其访问量目前占B站总体的30%,而生活、娱乐、时尚等多元化的兴趣圈层已经是B站的内容重头。”从结果上看,B站已经完成了从二次元立命向“后浪”立命的转变,其目标群体不再仅限于二次元用户,而是范围更广泛的年轻群体,2020年Q3,B站全站月活达1.97亿,同比上涨54%。


(左起:B站跨年晚会、后浪视频、说唱新世代)<br>
(左起:B站跨年晚会、后浪视频、说唱新世代)


对于处在衰退期,或是身处夕阳产业的垂直社区来说,转型问题更为严峻,甚至关乎生死。从方向上来说,衰退期社区转型不外乎两条路径,一条是向相关领域拓展,另一条路径是切换到现有资源可赋能的新赛道。具体到实操层面,则需要具体问题具体分析了。


3. 社区与社交


村上春树有本书《当我谈跑步时,我谈些什么》,标题的句式模仿了他的偶像雷蒙德·卡佛的《当我们谈论爱情时,我们在谈论什么》,这个句式同样也适用于我们接下来将要讨论的话题——当我们谈论社区与社交时,我们在谈论什么?


(左起:村上春树,卡佛)<br>
(左起:村上春树,卡佛)


社区和社交是一对易于混淆的概念,经常被人混作一谈。社区是由内容驱动的互动,解决的是人与内容连接的问题,而社交是关系链驱动的互动,解决的是人与人连接的问题。在互动形式层面,社区的互动形式为点赞/评论/转发等,而社交是IM,即时信息。


举例来说,典型的社区产品,除上文提到的一些,还有豆瓣小组、即刻、贴吧等;社交产品方面,有移动互联时代几乎可与社交划等号的微信,还有QQ、陌陌、探探等一批如同商量好了一般,由二字叠词命名的产品。



通过比较分析市场上现有的产品,可以发现绝大多数社区产品和社交产品一般兼具社交和社区元素,比如豆瓣小组,除了发帖、互动(社区),还可以发私信(社交);而微信,既可以对话(社交),也可以浏览、发布朋友圈(社区)


既然产品中既有社区元素,又有社交元素,那怎么区分一个产品是社区,还是社交?答案是看产品一级页面(其实也是产品侧重点)豆瓣小组一级页面是话题列表,私信功能在二级页面消息中,因此属于社区产品;微信一级页面是对话列表,朋友圈入口在发现tab的二级页面,因此属于社交产品。


(左起:豆瓣小组话题列表,微信对话列表)<br>
(左起:豆瓣小组话题列表,微信对话列表)


二、如何做社区?


1. 社区定位


我们在分析事物时,喜欢找追本溯源,即使是宇宙,在1970年也被论证出起源于一个奇点。那么,社区的奇点是什么?我认为是定位。社区产品经理在日常工作中碰到的很多问题,诸如社区功能完备但吸引不到用户?社区和竞品比起来没什么差异?社区越做越小众?都可溯源到社区的定位。


(霍金和彭罗斯,俩人证明了在合理前提下,奇点不可避免)<br>
(霍金和彭罗斯,俩人证明了在合理前提下,奇点不可避免)


社区定位也需要讲究基本法。虽然市面上流传着五花八门样式各异的产品定位方法,但基础的思路基本都来源于阿尔·里斯和杰克·特劳特合著的那本《定位——有史以来对美国营销影响最大的观念》,书里描述了定位工作的具体步骤。单纯讨论方法可能过于抽象,我们设定一个场景,结合具体案例来分析。场景设定为:如果在2011年,做一个股票社区,应该怎么进行定位?


首先,分析整个外部环境,确定“我们的竞争对手是谁,竞争对手的价值是什么”。2011年,A股市场在历经一轮牛熊之后,整体处在一个单边下跌的趋势中,市场低迷,活跃度相对2007年、2008年下降了很多。


此时,股民经常浏览的社区有股吧和淘股吧,两个产品的名字虽然只有一字之差,但是完全不同类型的社区产品。



股吧是东方财富旗下的股票社区,其slogan为:东方财富网旗下股票主题社区。股吧面向的是最广泛的股民群体,不对用户做过多限制,只要合规,用户均可在股吧内畅所欲言。淘股吧是“专业投资A股股票炒股论坛交流分享社区”,淘股吧每年都会举行数场实盘大赛,聚集了市场上最活跃的一批短线选手,如今在股民心中封神的“8年10000倍”的赵老哥,声名鹊起就是在淘股吧。对于普通用户来说,使用淘股吧的目的,或者淘股吧对用户的价值在于跟随牛人进行操作和挖掘最新的市场题材。


其次,避开竞争对手在顾客心智中的强势,或是利用其强势中蕴含的弱点,确立品牌的优势位置——定位。股吧背靠东方财富网,培养出的用户心智是在股吧不仅可以畅所欲言,还可以浏览丰富的UGC(User Generated Content,用户生产内容),了解全面及时的资讯、公告、研报等OGC(Occupationally-generated Content,职业生产内容)


股吧的短板也较为明显,一方面宽松开放的交流氛围,导致社区“杠精”横行,即便是较为专业的投资相关的讨论,也可能被杠精用户用各种言辞怼回去,从而导致优质内容生产者创作意愿越来越低,社区讨论氛围不佳。


另一方面,即使优质内容生产者有颗大心脏,对抬杠不做理会,或者不厌其烦地回怼,并且持续不断地输出优质内容,股吧的产品架构[强话题(这里的话题指股票)流+弱关注流]也决定了优质内容得不到充分的曝光,较难形成专业内容生态。


(股吧)<br>
(股吧)


淘股吧实盘大赛的模式决定了社区内短线牛人辈出,对题材的挖掘和逻辑的理解领先于市场,用户可以在淘股吧无脑跟随牛人操作,博取超额收益,或者学习牛人的实盘操作思路,化为己用。


淘股吧的弱点也显而易见,一方面淘股吧过分倚重实盘大赛,导致吸引来的用户多为超短线用户,用户圈层过窄;另一方面,淘股吧吸引来的用户,绝大多数并不具备牛人的能力,盲目跟随操作的结果是其投资生命周期的缩短,导致平台用户流失率过快。


(淘股吧)<br>
(淘股吧)


因此,在2011年,如果要新建立一个股票社区,需要避开的是竞品优势点有:OGC、实盘大赛等,在目标客群选择上,则需要避开过于狭隘或者过于宽泛的客群定位。剩下的,都是可走的,可能建立与众不同客户心智的道路。


例如,建立一个PGC(Professional Generated Content,专业生产内容)社区,或者一个以投资组合为中心的社区,或者一个面向价值投资者的社区等等。结合实际案例来看,上线于2011年11月的股票社区雪球,其定位“聪明的投资者都在这里”,就巧妙地避开了股吧和淘股吧更有优势的地方,选择能够建立起自身优势的方向——“它(雪球)不荐股,依靠用户生产内容,让喜欢独立思考的投资者都聚到这里,一起研究公司、聊聊投资”(雪球CEO方三文)


(雪球)<br>
(雪球)


再次,为这一定位寻求一个可靠的证明——信任状。定位确定之后,雪球主要从两个维度来建设信任状。首先在股票维度,雪球将个股详情页默认签设定为讨论,让用户在浏览行情的同时,能够实时了解该股最新、最热门、最精华的讨论,用户可以从股票的角度去挖掘牛人。


其次在人的维度,雪球对用户个人主页进行了专门的设计,在访问他人主页时,可以迅速了解这名用户的实盘/模拟组合收益率、擅长讨论的股票,以及过往的发言,另外,用户还可以动态选择自己的关注,通过持续和关注的人交流,知道哪些人擅长解答哪方面的问题,从而找到比自己水平更高、更“聪明”的人。


最后,将这一定位整合进企业内部运营的方方面面,特别是传播上要有足够多的资源,以将这一定位植入顾客的心智。在内部运营方面,早期的雪球采取的是封闭式的邀请注册制,运营团队先去找寻符合雪球气质的“聪明的投资者”用户,然后请这些用户去邀请与他们气质相近的人,保证雪球社区在越滚越大时,不会稀释原有调性。


另外,雪球专门设立了用户挖掘团队,团队成员会从海量的帖子中筛选优质内容,再主动联系内容的生产者,引导激发他们生产更多有关公司研究的文章,并通过转发等形式为文章倾斜更多流量。在外部推广方面,除了邀请优质作者访谈,参加线下雪球嘉年华活动,雪球还会在外部平台,如微博、微信公众号,转载平台用户生产的优质内容。


对于本身具有某类话题属性的文章,雪球还会将其收入至雪球周刊中,发布至微信读书、kindle等平台。对于平台上优质内容生产者创作的体系化的内容,雪球还会主动帮助作者联系出版社,进行包装出版。


通过上述工作,雪球在帮助内容生产者提升粉丝数、影响力,促进内容生态正向循环的同时,也向潜在用户植入了“聪明的投资者都在雪球”的心智。


(雪球创作者权益)<br>
(雪球创作者权益)


2. 产品架构


在明确产品定位之后,下一步是对产品架构的搭建。和“产品架构”相似的名词有很多:“业务架构”“战略架构”“信息架构”......这几个词像孪生兄弟一般,经常结伴出现,有时候还被人误用,给人剪不断理还乱的感觉。事实上,这几个概念之间确有交集,但又有所不同。


  • 战略架构/业务架构:最顶层的架构,包含商业逻辑在内的业务运转机制。


  • 产品架构:连接战略与信息的产品功能、系统的架构,具体的作用是将不同的功能围绕目标进行分类、整合。


  • 信息架构:最前端的架构,包含基础的交互设计、信息等表现层架构。



三种结构层层递进,相互联系,战略架构和产品架构的交叉点在于业务流程的梳理,产品架构和信息架构的交叉点在于产品系统的设计和界面呈现。本节主要讨论的是产品架构。信息架构相关的内容将融入在之后内容生产、内容消费等部分中。


目前,市场上有关产品架构设计的书籍、资料并不太多,出现这种情况时,往往有人选择去用产品经理领域的“万金油”——用户体验五要素去套产品架构设计,但结果可能差强人意。


Jesse James Garret的《用户体验要素》虽然是产品经理的必读书籍,它提供了一种足够抽象又易于理解的产品设计思路,即从战略层、范围层、结构层、框架层、表现层5个层面去设计产品,但用户体验五要素更多的是从宏观层面对产品进行解释。在实际落地层面,这个思路的指导意义并不强。



不过通过对有限资料的整理,还是可以抽象出一套完整的产品架构设计方法。


首先,枚举出产品的所有功能,从目标,或者满足用户某类需求的角度进行分类聚合。例如,兴趣社区即刻的“我”频道,基于用户相关信息与生产内容的角度,聚合了用户自己的动态、相册、档案、足迹等功能。


(即刻-“我”频道)<br>
(即刻-“我”频道)


其次,梳理功能上下游关系,形成流程。社区一般不涉及太复杂的上下游流程关系,从我自身的经验来看,社区最复杂的流程可能就是审核流程了。至于经常有用户反馈找不到拉黑功能,其实并不是功能到达流程太长、或者流程混乱的原因,大多数时候都只是因为产品经理担心做的太明显造成用户主动尝试,而故意这么设计。


在明确路径的情况下,从一级页面到拉黑功能,基本也只需要3到4次点击。


(即刻-被隐藏的拉黑功能)<br>
(即刻-被隐藏的拉黑功能)


最后,分析不同类别功能之间,或者不同流程之间的关系,并设计相互配合的机制。例如,在对内容生产功能进行设计时,需要同时考虑内容消费相关的功能设计。还是以即刻为例,在对发帖功能进行设计时,除了思考能否添加图片、上传视频等编辑功能,还要考虑内容发布成功后,内容怎么分发,用户在哪些页面可以浏览到发布的内容,以及内容如何展示,用户能不能点赞、评论、转发等等。


(左起:即刻-内容编辑页面,即刻-内容消费列表)<br>
(左起:即刻-内容编辑页面,即刻-内容消费列表)


一千个人眼中有一千个哈姆雷特,即使按上述同一套规则,针对同样一个命题进行产品架构设计,不同的人给出的结果可能千差万别。是否存在一种标准,可以对产品架构的设计结果进行评判?


一般而言,具有简单高效、易懂易用、扩展性强3个特点的产品架构,我们就可以认为是好的产品架构。此处不做展开。讲完了产品定位和产品架构,下面从内容的角度讲下互联网社区的热搜话题。


3. 内容生产


按生产者的角度,内容可分为UGC(User Generated Content,用户生产内容)、PGC(Professional Generated Content,专业生产内容)和OGC(Occupationally-generated Content,职业生产内容)三类。


举例来说,我,一小白,在B站上传了一段关灯吃面的视频,这就是UGC;B站知名up主华农兄弟,投稿了一篇烤兄弟家鸭子吃的视频,是PGC;B站官方号,上传的跨年晚会,则是OGC。


社区语境下,我们平时所讲的内容,主要指向UGC,但绝多数社区的内容其实也包含了PGC和OGC(现在可以想到的不包含PGC和OGC的社区,只有完全去中心化、用户可以自己建吧/小组的百度贴吧和豆瓣小组)


(社区与UGC/PGC/OGC的关系)<br>
(社区与UGC/PGC/OGC的关系)


OGC来源主要有3个,分别是自制、外购和爬虫,具体选择哪种方式,取决于社区本身的定位、调性和钱袋子。对于社区来说,OGC最为稳定可控,可以给用户以确定预期,但成本最高。此外,OGC一般为全量分发,可为社区用户提供共同的话题,增进互动。


UGC和PGC虽然都来源于用户,但对于平台而言,前者主要负责提高活跃度,后者则用于提升平台的专业度。虽然多数社区既有UGC,又有PGC,但两者很难并重,一定是头重脚轻(头可能是UGC,也可能是PGC)


例如,上文在社区定位一节提到,股吧的活跃度明显高于其他社区,但优质内容较少,而雪球虽然具有更多的优质内容,但活跃度很难进一步提升。设想雪球如果选择霸王硬上弓,选择通过放松审核,或者在信息流中插入更多泛金融化内容等方式,去吸引更多“没那么聪明的投资者”,那么很有可能导致平台文化的稀释,以及劣币驱逐良币现象的出现。本节讨论内容主要是UGC和PGC的生产,不涉及OGC。


总结来看,社区设计者在内容生产方面,主要有以下几方面工作。


一是定义优质内容。设想这样一种场景:你新下载了一个社区app,打开之后,界面一片空白,只有正中位置一行小字:暂无内容,可以试试发言哦~这时的你,是不是要么直接走人,要么尝试去发言,但又不知道讲点什么,结果可能是纠结了一会儿什么都没发,也可能是打了个“1”发了出去。


因此,在对内容生产体系进行构建时,首先要做的,就是提供一个优质的内容范本,作为用户内容生产的基础参考。另外,对于优质内容的定义,其实也是对社区文化和价值观的定义,如果定位精准,之后的工作将事半功倍。


二是生产优质内容。在社区建立初期,优质内容谁来生产将是一个不得不面对的问题。一种方法是运营或者编辑人员生产,虽然此类内容质量可以保证,或者说达到及格线才可发布出去,但数量有限;另一种方法是邀请符合条件的优质用户去生产,这个思路产生的内容数量可能更多些,但生产频率和质量不可控。


不管采用上述哪种方法,或者两者兼具,主要目的还是在于提供优质内容范本,给用户以参考,最终想要实现的效果还是促进社区形成一个自我循环的内容生态。在社区内容生态建立起来后,社区官方的主要的任务,就变为持续提供增量的优质话题,供用户讨论。


此处提到增量话题,稍作发散。经常有人问:XX行业适不适合做社区?其实只要看这个行业能否持续提供增量话题就够了。


例如,股票相对基金,天然就更适合做社区。股票对应的上市公司,每天都会产生各种各样的信息,基本面信息、技术面信息、消息面信息等等,而反观基金,基金的很多信息,如持仓股票、持仓比例等,一个季度才更新一次,每天更新的也就一个净值,其实时间也无风雨也无晴,让用户去聊,聊什么呢?


所以,我们可以看到,多数股票社区,并不强调运营,而基金社区刚好相反,投票、话题、小游戏等内容天天更新。


(左起:股票社区,基金社区)<br>
(左起:股票社区,基金社区)


三是标记优质内容。在社区上线之前,就应建立起一套完善的内容标记体系,将优质内容筛选出来,给予流量曝光。


标记的方式有多种,可以通过人工逻辑,如审核人员在审核时顺带标记,或者建立专门的运营小组,对优质内容标记,也可以通过系统自动化逻辑,如机器自动根据互动数据计算热度,超出一定热度值的内容标记为优质,还可以通过人机搭配逻辑,机器先筛选出优质内容备选池,再由人工选出优质内容,提升效率。


上述方式没有绝对的好坏之分,追求效率可以全机器,追求精准可以全人工。


四是激励优质内容。激励机制可以为内容生产者提供持续创作的动力,是内容生态良好运转的重要一环。激励主要有精神和物质两种,实操层面,又分为以下三类。



  • 一是流量倾斜,通过置顶、信息流主动推荐、扩大分发范围等操作,增加优质内容曝光;


  • 二是提供差异化功能,如专栏、直播等权限,以及勋章、加V等认证,来提升优质内容生产者对于平台的认同感;


  • 三是创作变现,除了打赏、开放广告权限等基础操作,还可以帮助优质内容生产者打造在线课程(知乎),出版实体书籍(雪球)等。


(左起:知乎、雪球)<br>
(左起:知乎、雪球)


4. 内容审核


内容审核应该是计划进入社区领域的机构最为关心的问题。在具体谈论审核前,需要明确下内容审核的概念范围。一般而言,审核分为两类,一类是合规性审核,一类是质量审核。我们平时所讲的内容审核,主要指的是合规性审核,即对内容是否违反国家法律法规进行审核。质量审核是对内容质量的判断,属于内容运营相关的内容,本文不做展开。


合规性审核是社区的底线。只有经过合规性审核的内容,才能展示在前端。可能是因为维系一个人工审核团队成本太高,或者人工审核可能出现错审漏审的情况,很多人对内容审核的疑问普遍集中在机器审核是否可以替代人工审核?


就目前情况而言,机器还是不能替代人工,原因也很简单,就是机器并没有大家想的那么智能,就像Siri这种顶尖的人工智能机器人,如果你问的问题稍稍跳脱它给出的范围,它的“智商”就会断崖式下降,只会跟个二傻子一样讲冷笑话。


就之前了解到的情况来看,目前涉及UGC的公司,基本还都是使用人工来对内容审核。机器现在做的,更多的是第一步的关键词过滤,如提到某些关键词,内容就一定违规,机器做的就是将这些内容直接过滤掉,不用再走到人工那一步。


对于内容审核流程来说,必需的有以下三个环节,分别是:机器审核,人工审核,人工质检。机器审核如上所述,主要作用为关键词过滤,过滤掉100%违规的帖子,减少人工审核的工作量;次要作用为内容打标(视频审核的话,机器还会对视频进行随机截帧),标签的维度多种多样,目标始终是围绕着提升人工审核的效率。


内容到达人工审核这一步时,审核人员看到的,已经是机器处理过的内容。审核人员通过浏览原始内容和机器给的辅助判断信息,迅速对内容合规性作出判断。人工审核难免出现误差,因此,一般社区还会增加质检,即随机抽取已审核内容进行再次审核,确保内容的合规性。


5. 内容消费


用户在社区内消费的内容,按照内容分发逻辑来看,主要分为3类:话题信息流,关注信息流,以及推荐信息流。


话题信息流,是以话题聚合的内容列表,如某个豆瓣小组的帖子列表。话题信息流排序方式较为简单,不外乎最新发帖序、最新更新/评论序,以及热门序。前两个比较容易理解,热门序是通过热度算法,将近期热门帖子筛选出来,并以热度值进行排序的排序方式。


可能有人好奇具体的热门算法,其实业内普遍使用的都是“热度值=(初始热度值+互动热度值)*时间衰减因子”的公式。更具体的举例来说,可以将上述公式细化为:热度值=(初始热度值+(阅读量*x+转发量*y+分享量*z+评论量*a+点赞量*b+收藏率*c+触发关注量*d+作者个人主页打开量*e))/(e^(k*(t1-t0)))。


其中,“初始热度值”和作者属性、内容属性以及实体属性相关,“(e^(k*(t1-t0)))”是基于牛顿冷却定律的时间衰减因子。


关注信息流,是用户关注的人发布信息组成的内容列表。关注是用户主动触发的行为,理论上关注信息流中的所有信息,用户都想要阅读。因此,早期关注信息流均是以最近发布时间进行排序。但随着用户关注的人的增多,用户的关注列表页冗余起来。


即使用户很久都不再点击某个关注的人的内容,用户也很少主动去取消这个人的关注,但这种情况就可能造成,用户真正感兴趣的人的内容得不到曝光,平台整体粘性降低。


由此,微博率先将关注信息流默认排序,由最近发布时间改为基于用户对关注者的喜爱程度、内容质量等多维度计算的智能推荐序,虽然骂声一片,但微博还是以虽千万人吾往矣的气概坚持了这次改动。2020年,微信公众号也做出了类似优化。


(左起:微博信息流、微信公众号文章流)<br>
(左起:微博信息流、微信公众号文章流)


推荐信息流。早期,社区只有话题信息流这一种内容分发方式,RSS订阅关系的产生,使得关注信息流出现。SNS社交网络兴起,全民自媒体时代到来,内容数量迎来爆发式增长,个性化的推荐信息流应运而生。


最近几年,推荐信息流是社区届的热门话题,但并不是所有社区都适合推荐信息流。


首先,个性化推荐需建立在海量内容的基础上,且推荐内容越个性化,对内容数量的要求也就越高,例如,一个社区一天1万篇帖子,可被推荐的内容按二八定律,大概有2000篇,如果内容标签有100个,则平均分到每个标签的内容大概只有20篇,被打上某个标签的用户在移动端,只需刷新一次就可浏览完所有个性化内容。


其次,推荐信息流的目的在于引导用户沉浸,但前提是推荐的内容具有较低的消费门槛。如果社区内容本身偏专业,消费完一篇就已经花费了一定的时间和精力,则用户很难在这个推荐流里停留。举例来说,如今被称为时间黑洞的抖音,其主要内容类型是娱乐化的短视频,用户不用动脑,一个个视频刷过去,沉浸其中的同时,时间也流逝掉了。


再次,推荐信息流提供的是未知的、不确定的内容,在产品架构设计上,推荐信息流往往会被放置在发现频道,其本质是反效率的。


至于稍显神秘的推荐算法,其实也不复杂,一句话概况,就是“物以类聚,人以群分”。物以类聚,是基于内容属性进行相似性推荐,如从作者或者内容层面(类别、标签、关键词等),利用TF-IDF方法,计算内容之间的相似度,推荐给用户他点击过的高相似度的内容。


人以群分,则是基于用户行为进行协同过滤推荐,基本思路是将用户的行为作为特性,计算用户相似性和物品相似性,进行信息匹配。


典型的例子有,用户A和用户C都阅读了内容1和内容3,用户B阅读了内容2。基于阅读行为来看用户相似度,用户A和用户C更为相似。因此,在用户A新阅读了内容4之后,可以将内容4推荐给用户C。更详细的算法推荐内容可以参考项亮的《推荐系统实践》,坊间传言字节跳动最原始的推荐算法逻辑即来源于本书。



三、写在最后


终于写完了。一开始没准备写这么多,但一不小心提纲列大了,写的时候也没搂住。但即便这样,社区产品运营相关的内容,如内容运营后台搭建、社区氛围建设,本文还是没有覆盖到,以后找时间再写吧(实际上应该不会再写了/手动狗头)



因为这篇文章,最近一个月下班后的时间、周末,还有元旦假期,全搭了进去了,睡眠严重匮乏,现在唯一想的,就是今天终于可以早点睡了。May the force be with me.


主要参考资料:

[1]《乡土中国》,费孝通,人民出版社

[2]《跨越边界的社区》,项飙,生活·读书·新知三联书店

[3]《俞军产品方法论》,俞军,中信出版集团

[4]《定位》,阿尔·里斯,杰克·特劳特,机械工业出版社

[5]《幕后产品:打造突破式产品思维》,王诗沐,电子工业出版社

[6]《运营有道:重新定义互联网运营》,李明轩,机械工业出版社

[7]《内容算法:把内容变成价值的效率系统》,闫泽华,中信出版社

[8]《推荐系统实践》,项亮,人民邮电出版社


本文来自微信公众号:黑坝(ID:HolylandofKalin),作者:许昕