赞
踩
本篇的code和data: GitHub
关联规则是在data mining尤其是探究两者间相关关系的问题时经常用到的概念。举个栗子,在transaction data中我们常常需要从其中找到是不是顾客在选择一些商品时有明显的正相关性,这样我们就可以把两种商品的距离拉近以提升销量。而更直接的栗子就是当你在购物网站浏览商品时旁边的推荐。
关联规则的量度有三个,支持度(support),置信度(confidence),提升度(Lift)。
假设我们这里研究销售A商品会不会带来B商品的提高,用 A → B \ A\rightarrow B A→B 或 { A , B } \{A,B\} { A,B}(其中A、B不分次序)表示这一关系
支持度(support)
s u p p o r t ( { A , B } ) = 购 买 A 商 品 和 B 商 品 的 次 数 总 购 买 次 数 support(\{A,B\})= \frac{购买A商品和B商品的次数 }{总购买次数} support({ A,B})=<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。