关联规则是什么 ?

关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度和信任度。

关联规则最初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。假设分店经理想更多的了解顾客的购物习惯。特别是,想知道哪些商品顾客可能会在一次购物时同时购买;

为回答该问题,可以对商店的顾客事物零售数量进行购物篮分析。该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。

关联规则研究

由于许多应用问题往往比超市购买问题更复杂,大量研究从不同的角度对关联规则做了扩展,将更多的因素集成到关联规则挖掘方法之中,以此丰富关联规则的应用领域,拓宽支持管理决策的范围。

如考虑属性之间的类别层次关系,时态关系,多表挖掘等。围绕关联规则的研究主要集中于两个方面,即扩展经典关联规则能够解决问题的范围,改善经典关联规则挖掘算法效率和规则兴趣性。

关联规则(association analysis),是一种基于规则的机器学习方法,用于发现隐藏在大型数据集中的有意义的联系。可用来寻找购物篮数据之间的联系,方便进行交叉销售;可以进行文本挖掘;也可使用在其他领域比如生物信息学、医疗诊断、地球科学等,发现一些有趣的联系。

•项集:包含0个或多个项的集合,包含k个项的集合称为k-项集.例如 :{Milk,Bread,Diaper}

•关联规则:形如X->Y的蕴含表达式,其中X和Y是不相交的项集.例如:{Milk,Diaper}->{Beer}

•支持度(Support):表示项集{X,Y}在总项集里出现的概率,公式为:

•置信度(Confidence):表示X发生的情况下,由关联规则”X→Y“推出Y的概率。即在含X的项集中,含有Y的可能性,公式为:

•提升度(Lift):表示含有X的条件下含有Y的概率与Y总体发生概率之比,公式为

•频繁项集:对项目集的支持度设定一个最小阈值(minsup),所有支持度大于这个阈值的项集就是频繁项集。

对于关联规则{Milk,Diaper}->Beer:


欢迎分享,转载请注明来源:民族网

原文地址:https://www.minzuwang.com/life/1023280.html

最新推荐

发表评论

评论将在审核通过后展示