当前位置:   article > 正文

排序(rank)后重排(re-rank)?

rerank如何影响原来的排序

说起排序,对排序的认知还停留在召回阶段召回的item经过粗排过滤,剩下较少的item在精排中打分,按epcm或者其他策略挑选出最终要曝光的item。精排模型往往都是point-wise的,一个DNN加丰富的用户/item/上下文特征预估点击率。自从看了阿里这篇 《Revisit Recommender System in the Permutation Prospective》,了解到了排序完可以再一次重排,以达到用户体验最佳,且平台收益更好。下面就来详细看下重排到底做了啥?

v2-071e132c7353c2be34deb925be1bf617_b.jpg
十方@炼丹笔记

permutation-wise

听过point-wise,pair-wise,也听过list-wise,permutation-wise 还是第一次听。

所以什么是permutation-wise?

见下图:

v2-4fa4c1eaf5ce4dd14960765e9d27aa69_b.jpg

这个图给了个真实的案例,一个User,给他展示了A、B、C就不会买任何item,给他展示了B、A、C就后购买A。What? 论文给了个例子,如果把贵的商品B放前面,用户就会觉得A便宜,值得购买。

好像很有道理,所以我们看到,如果是list-wise的模型给排好序的的B->A->C分别预估一个分(0.38, 0.40, 0.36),然后按照这个分重排序,就会得到A->B->C,用户就不会购买了。

如果我们提供多个候选排列队列: A->B->C和B->A->C,然后把list-wise的分加起来,得到不同排列的分,那就会得到最优解,B->A->C。

但是一般情况下,需要重排序的item可能有上百个,上百个item做排列,再过list-wise模型预估,这是不现实的,于是论文提出了两阶段的重排序框架PRS(Permutation Retrieve System),分别是PMatch阶段和PRank阶段,整体架构如下图所示。

v2-fe558b137fd47e1a5746ce3338a28ee4_b.jpg

PMatch

PMatch一句话总结就是,把上百个item的排列都给list-wise模型预估排列分不现实,PMatch负责挑选出候选的排列。论文提出了一种permutation-wise和goal-oriented的beam-search算法,称为 FPSA (Fast Permutation Searching Algorithm)。

首先需要离线训练模型,预估item ctr和next score,next score表示用户看完这个item后是否会往下继续浏览。这两个模型都是point-wise的,定义如下:

v2-0fe85b2049d3de5d512ad5e9f7b7e405_b.jpg

f函数就是relu,loss用log loss即可。

在线的时候,就要用beam search的方法,选择候选排列了。方法如下:

v2-e3d41a2094f11372ff0be47fa0003a3a_b.jpg

总结一下,就是先对所有待排列的item,预估出ctr和next score,然后设定输出长度n和beam search大小k,还有两个超参数。

beam search不过多介绍,我们看算分的地方,rPV会累加序列中每个item曝光的概率*每个item会带来下次曝光的概率,这个值肯定越大越好,能够让用户更加深度的探索。

rIPV会累加每个item曝光的概率*点击率,这个值越大,表示序列中item被点击的概率更高,因为曝光概率受上一个item影响,所以pExpose *= PNext。最后选择rSum高的排列,进入下一阶段。

PRank

v2-dcff475e4e348a2e57fb2b956fa38ec2_b.jpg

这个阶段就比较简单了,先离线训练一个模型,该模型输入是一个长度为n的序列 (x1, x2, ..., xn),然后输入到Bi-LSTM里,就会得到n个隐向量,每个隐向量concat用户特征和序列中每个item的原始特征,过mlp预测点击率即可:

v2-50f7d455ff9a12e765c47eff9e13a542_b.jpg

线上服务时,通过上述模型对每个候选排列进行点击率预估,直接把队列中每个物品的预测点击率之和作为评判标准,挑选最终的排列:

v2-87f2532f7cbc98a73c12a8e9e9f27274_b.jpg

实验

实验结果就是效果贼好,性能还贼优。

v2-264980786106e720a6fe259ae09ee5b5_b.jpg

v2-f76de506aaddcbf81a545e62756a005f_b.jpg

v2-0bc56f3c2a5ab7f32232e07201903743_b.jpg

v2-071e132c7353c2be34deb925be1bf617_b.jpg
更多干货,请关注公众号:炼丹笔记

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/378499
推荐阅读
相关标签
  

闽ICP备14008679号