公众号“乱序”猜想

temp66
temp66 这家伙很懒,还没有设置简介...

0 人点赞了该文章 · 21 浏览

公众号“乱序”猜想

内容重复和内容“折叠”这两个公众号的内生问题,直接影响了用户的内容消费体验。长此以往,用户会大量流失,创作者会陆续出走。这样的情景绝不是微信公众平台想看到的,必须作出应对。公众号“乱序”(智能排序)就是微信团队给出的一个解决方案,目的“是为了让用户看到更多更好看的内容。”那这个乱序背后有什么样的设计逻辑呢?一起看看。

最近在看《内容算法》,一本有关内容推荐的入门书,前今日头条产品经理闫泽华写的。

书不厚,但干货不少,既解答了我此前对于头条号、豆瓣、知乎等内容平台部分功能设计的疑问,也给我关于公众号“乱序”(官方称之为公众号智能推荐)的思考提供了一个解题方向。

01 公众号此前存在的两个问题

1)内容重复

内容重复是内容生态大繁荣的伴生问题,是所有内容平台发展到一定阶段的通病,非公众号一家独有。

一个热点事件发生后,权威新闻源(比如人民日报,城市官媒等)会发布新闻通告,自媒体会从不同角度进行评论,营销号会批量产出蹭热点的内容。所以我们之前经常会在订阅号列表里看到,“n屏都是看了标题就不想点进去的内容”。

一篇优质文章(尤其是爆文)诞生后,大量账号也会加入转载行列。比如“得到”公众号发布罗振宇2021“时间的朋友”跨年演讲全文后,在我关注的公众号中,包括但不限于“罗辑思维”、“笔记侠”、“腾讯科技”、“深燃”等都进行了转载,有的是标题、封面、描述不做修改的转载,有的是调整其中一个或多个元素的转载(之所以强调这一点,是因为它涉及到内容推荐优化的一个逻辑,第二部分会细讲)。

大家来看一个数据,新榜1月9日发布的:据新榜日常监测的162万微信公众号样本数据显示,2020一整年,公众号发文总篇数超过了3.87亿,其中标注原创篇数为2289万篇,占比为5.92%。

2289万篇文章,其中有多少比例是转载的,这份成绩单里没写。

不过,我们可以从新榜2017年的数据略窥一二:2017年原创文章占比4.6%(略低于5.92%),其中11月标记转载和原创的比例是3:1,也就是说,平均每1篇原创内容被转载3次。

要知道,这数据还是平均过后的,大号每篇文章被转载的真实数据往往都是几十几百的,而且好的文章会在各个大号中互转,内容重复展现是比较寻常的。

2)内容“折叠”

这里的内容“折叠”,不单指公众号次条以下被真实折叠了的文章,还包括那些出于各种原因没被读者读到的文章。

因为职业需要,我关注了各种各样的订阅号,数量有点多,1071个。所以我的订阅号消息列表每天都会很热闹,有好几百条更新。不过,我获取一次性消息的对象条数是有限的,一般是两位数。也就是说,很大一部分内容是没有被自己看到的。

这不是个例。

据微信团队统计,在严格的时间排序下,用户在消息列表看到的卡片,大多其实都是完全不读的帐号,用户本身常读号的卡片,大量都没有被用户看见。

内容重复和内容“折叠”这两个内生问题,直接影响了用户的内容消费体验。长此以往,用户会大量流失,创作者会陆续出走。这样的情景绝不是微信公众平台想看到的,必须作出应对。

公众号“乱序”(智能排序)就是微信团队给出的一个解决方案,目的“是为了让用户看到更多更好看的内容。”

02“乱序”该怎么设计才合理?

那“乱序”究竟是怎么“让用户看到更多更好看的内容”的?

所谓公众号“乱序”,从表面上看,是系统在原本严格的逆序时间线里,把部分历史文章抽取出来,穿插其中(经观察,基本都是穿插在发布5分钟内的文章之后)。

这就引出大家都很关心的一个问题,系统是怎么抽取这些文章的,存在哪些策略或规则?

我们把时间拉回2018年,当时公众号刚内测按逆序时间线排序的“信息流”(行业内是这么口口相传的,尽管张小龙本人不认为这是“信息流”),知名自媒体人caoz在体验后就提出了一套可能的“信息流”设计策略:

1)原创指标,被认证的原创文章可以获得1小时的优先资格。

2)置顶指标,用户置顶的公众号,其内容可以获得8个小时的优先资格。

3)好友指标。如果一篇文章在近期有多个好友点赞,或多个好友转发,我认为这个应该是我会优先关注的内容。这个前提是,我已经订阅的内容。

4)负评指标。当负评达到一定程度,在排序的时候扣除其一定的时间资格,并基于此降低其排序和曝光量。

公众号:caoz的梦呓

这套策略已经有“乱序”的影子了,其中置顶指标,有点类似目前微信团队已经公布出来的“常读用户”指标,而好友指标,很可能也是当下“乱序”策略的重要参数。可谓非常有预见性的想法了。

不过,它主要还是站在保护原创者利益的角度出发,是有局限性的。caoz自己也在文章中承认了这一点,“存在屁股决定脑袋的现象,可能不够公正和中立。”

还有一点就是,它没有解决我们前面提到的内容重复和内容“折叠”的问题。所以我在想,有没有可能引入另外一个指标:内容消费预判指标(指标名字是自己编的,思路来自《内容算法》这本书)来优化读者的阅读效率。

根据用户对内容的消费过程,我们可以将读者对内容的消费拆解为列表页消费和详情页消费。前者关系到点击前的消费预判(下图左),后者则代表了用户点击后的消费体验(下图右)。

基于这两个维度拆分,我们能够得到这样一张表格(如下图):

三种场景分别对应了公众号内容重复的三种处理方式:

情况A(甲、乙两篇内容,详情页都相同,即转载):

从消费者角度看,甲、乙两篇内容对用户来说是具有替代性的。用户消费了甲内容之后,大概率不需要再消费乙内容了。

那么,如果读者关注的公众号中相近时间段内发布了甲、乙两篇相同的文章,且读者已经读过甲文章了,乙文章就没必须通过“乱序”穿插到前序消息列表中;但如果读者两篇文章都没看过,系统可以根据其它维度比如原创,选择其中一篇文章进行穿插。

情况B(甲、乙两篇内容,列表页相同/相似,详情页不同,即同选题):

前面提到,每次热点事件发生后,都会产生大量追热点或蹭热点的文章。尽管用户点击后的消费体验不同,但是相似的列表页展示(标题、封面和描述)会给用户带来消费决策上的困惑。

如果用户点击过了甲内容,他很有可能会认为乙内容和甲内容是重复的,或者并不想在当下密集地看到相似内容,从而忽略/错过了乙内容。对于乙内容来说,这会导致曝光减少。对于这种情况,应该拉长两篇内容的展示间隔,通过呈现顺序的改变,将相似的内容分散开,从而避免用户视觉疲劳。

当然,这里的拉长依然遵循当下的“乱序”规则,不是指在发布后的5分钟内。

情况C(甲、乙两篇内容,列表页和详情页都不同):

这种情况是最简单的,两篇完全不同的内容,互相不构成对用户消费预判的影响,从其它维度进行“乱序”排列即可。

最后,来聊聊官方已经公开的另一个指标,即时效性指标。

公众号“乱序”功能上线后,一些对时间敏感的用户比如我们做媒体要求新闻时效性,就会很不习惯。对于这一点,微信团队在接受知晓程序采访时透露,“我们的团队也在加紧对时效性的问题进行更新,我们不是让时效性的文章一定会出现在所有用户的第一位,我们会通过算法调节,让喜欢看时效性文章的用户,他的时效性文章能够更快地排到前面去。”

这段话大有深意,不仅直接表达了时效性指标的存在,也间接说明了公众号完全可以根据我们的内容消费标签,实现相对精准的内容排序展示。

注:以上仅代表自己对公众号“乱序”的猜想,不代表当下公众号“乱序”的真实算法。

03 “乱序”建立的新秩序

微信团队关于“乱序”的解读中,我觉得有一段话非常值得深思:

“我们会认为读者点关注这个按钮,代表的是过去的他关注了过去的你,因为你的内容也是在变化的,他的喜好、行为习惯其实也都是在发生变化的,人都是在变化的,内容也都是在变化的。他关注的时候仅仅是代表那个时候的他喜欢那个时候的你,并不能代表未来。”——公众号:知晓程序

看到一篇好文章,我一般会认为创作它的公众号会是一个高质量账号,然后会不吝惜点下“关注”按钮。

但随着看到的好文章越来越多,关注的公众号列表也越来越长,原本严格时间线排列带来的秩序,反而造成了一种混乱和错位。

有些账号可以给当时的你大致符合需求的内容,你开始也确实非常喜欢觉得还不错,当你的订阅号列表被这些已经不太喜欢的内容占据时,你真正想看的内容的位置就被挤占,比如你通过一个公众号已经获取了你看似需要的内容,那你去获取新内容的动力就已经不太强了。

而“乱序”的出现,就是尝试打破这种看似有序的平衡,进而建立新的秩序。

这种新秩序,关于内容,也关乎内心。

 

发布于 2023-03-29 03:16

免责声明:

本文由 temp66 原创或收集发布于 火鲤鱼 ,著作权归作者所有,如有侵权可联系本站删除。

火鲤鱼 © 2024 专注小微企业服务 冀ICP备09002609号-8