赞
踩
目录
一般而言,收集的数据越多,对用户和推荐内容的了解就越全面和深入,推荐效果就越精准。
矩阵分解(MF),是最常用的推荐算法之一。我们将用户对物品的反馈用矩阵表示,这个矩阵也被称为评分矩阵。将原始评分矩阵
分解为
和
,使得:
.
其中,为
,
(用户隐向量矩阵)的维度为
,
(物品隐向量矩阵)的维度为
,
是一个较小的数。
MF的优化函数如下:
MF算法通过优化式(1)来填充和预测缺失的评分值,其中代表原始评分矩阵中用户
对物品
的非0评分,而
代表用户
的隐向量,
代表物品
的隐向量。该函数的优化目标是:使得用户
的隐向量
与物品
的隐向量
之间的点积值,与评分矩阵中用户
对物品
的实际评分值
尽可能接近。
推荐系统的另一种常用算法是因子分解机(FM),它将推荐问题归结为回归问题。传统的线性模型只能捕捉到线性信息,不能捕获非线性信息,也就是特征与与特征之间的相互作用。
这种特征与与特征之间的相互作用,就是特征工程中常用的交叉特征(也称为组合特征)。FM模型如下式所示,
假设公司A是以书籍为内容进行推荐,而公司B是以电影为内容进行推荐。根据协同过滤的思想,具有相同观影兴趣的用户很可能有相同的阅读兴趣。
这个场景下,每一家公司分别有用户对物品的评分矩阵,但由于隐私保护的原因,公司不能共享这些评分数据。按照上面介绍的MF算法,它将评分矩阵分解为用户隐特征向量和物品隐特征向量。由于两家公司的用户群体相同,它们共享用户的隐向量信息。接下来,这个算法的流程描述如下:
个人理解这个方法的核心思想是:的更新用到了联邦学习的优势,并且由于
是保密的,因此可以保护隐私安全。
假设公司A是一家在线的书籍销售商,公司B是一家社交网络公司,公司B不直接销售商品,但是它有每个用户的画像数据。如果能够利用这部分数据,则对公司A的销售额同样有很好的提升。
假设现在公司A有用户的反馈分数和部分特征信息,设为,而公司B拥有额外的特征数据,设为
,其FM模型可以表示为
下面给出联邦学习因子分解机的详细算法流程:
本读书笔记系列针对2021年5月出版的《联邦学习实战》(见下图),后续部分将逐步更新
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。