复盘一个在京东做的热门召回策略设计方法
专业成就职业
大家好,我是策略产品经理夏唬人。
在推荐系统当中有一个经典的问题:EE问题。
EE具体是指:Explanation和Explorer。
这两个实际上对应了衡量推荐系统做的好坏的两个核心指标:可解释性和探索性。
直白点讲:可解释性是指为什么给用户推荐这个item,它是有理由的,一定程度上代表了推荐系统的准确性;探索性是指如何基于推荐结构来挖掘更多用户潜在的兴趣点,一定程度上代表了推荐系统的新颖性,有时候也叫惊喜度。
准确性我们通常能够通过更精准的用户画像来保证,那么新颖性怎么保证?
热门召回策略就是一个很好的方法,用来挖掘用户潜在的偏好点。
所谓的热门召回通常是指基于特定维度下去计算每个item的得分,一般命名为热度得分,得分越高,表明在平台的热度越高,按照热度选出TopN的item。
比如:
对于商品我们可以衡量商品的销量,好评,下单转化,点击转化,优惠力度等等;
对于短视频我们可以衡量短视频的播放量、点赞量、收藏量,完播率,点赞率,转发率等等。
当然,需要特别注意的是,在选取表征每个item热度的特征时候,要尽量能反映商品的真实热度,同时给与不同的权重。例如,对于一件商品来说,下单率比点击率往往更能反映买家对商品的喜爱程度,较高点击率而较低下单率的商品可能存在标题党问题;同样对于一个视频,完播率可能更重要些。
还需要注意的是,不同的商品由于推荐系统分发策略的问题存在曝光量不同甚至差别很大的情况,因此直接比较各种指标会存在公平性问题。比如薯片销量为10W和电脑销量为100台明显不具有可比性,在实践中,通常可以采用归一化的方法,使得各商品间指标具有可比性。
这个我们上上周的视频号直播提到了,感谢兴趣的可以回复【数据能力直播】,观看回放。
接下来,给大家重点介绍一种我之前在京东做过的热门召回中热度计算的策略,用在其他类型的业务其实也可以。
基于牛顿冷却定律
牛顿冷却定律是指我们在物品热度计算当中增加了时间衰减因素,进而使得热度计算更加合理,一定程度上能够减轻基于得分排序的一些不良问题,比如马太效应。
热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分
其中:
S0:按照商品类别给予商品不同的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光,通常会参考商品本身的特征,比如上面提到的销量(sale),好评(comment),下单转点击转化(CXR),优惠力度(discount)。这样我们就能够得到商品本身的初始热度:
S0=W1*saleScore+W2*commentScore+W3*CXRScore+W4*discountScore
S(Users):对于单个商品,用户可以点击阅读(click),收藏(favor),分享(share),评论(comment)这四种行为,我们为不同的行为赋予分数,就能得到商品的实时用户行为分为:
S(Users) = W1*clickScore + W2*favorScore + W3*commentScore + W4*shareScore
牛顿冷却定律: 本期温度 = 上一期温度 x exp(-(冷却系数) x 间隔的小时数)
相应的我们可以在热度计算当中加入时间的因素:
T(Time) = e ^ (k*(T1 – T0)) 其中T0是商品发布时间,T1是当前时间。
以上就是之前常用的一种热度策略的设计方法