关联规则学习

编辑
本词条由“匿名用户” 建档。

关联规则学习是一种基于规则的机器学习方法,用于发现大型数据库中变量之间的有趣关系。它旨在使用一些有趣的度量来识别在数据库中发现的强规则。在具有各种项目的任何给定交易中,关联规则旨在发现确定某些项目如何或为何连接的规则。 基于强规则的概念,RakeshAgrawal、TomaszImieliński和ArunSwami引入了关联规则,用于发现超市销售点(POS)系统记录的大规模交易数据中产品之间的规...

关联规则学习

编辑

关联规则学习是一种基于规则的机器学习方法,用于发现大型数据库中变量之间的有趣关系。 它旨在使用一些有趣的度量来识别在数据库中发现的强规则。 在具有各种项目的任何给定交易中,关联规则旨在发现确定某些项目如何或为何连接的规则。

基于强规则的概念,Rakesh Agrawal、Tomasz Imieliński 和 Arun Swami 引入了关联规则,用于发现超市销售点 (POS) 系统记录的大规模交易数据中产品之间的规律性。 例如,规则 { o n i o n s , p o t a to o e s } ⇒ { b u r g e r } {displaystyle {mathrm {onions,potatoes} }Rightarrow {mathrm {burger} }} 超市的销售数据表明,如果顾客同时购买洋葱和土豆,他们很可能还会购买汉堡肉。 此类信息可用作营销活动决策的基础,例如促销定价或产品放置。

除了上述来自购物篮分析的示例之外,关联规则如今还用于许多应用领域,包括 Web 使用挖掘、入侵检测、连续生产和生物信息学。 与序列挖掘相反,关联规则学习通常不考虑事务内或跨事务的项目顺序。

关联规则算法本身由各种参数组成,这些参数会使那些没有数据挖掘专业知识的人难以执行,其中许多规则难以理解。

定义

编辑

按照 Agrawal、Imieliński、Swami 的原始定义,关联规则挖掘问题被定义为:

设 I = { i 1 , i 2 , … , i n } {displaystyle I={i_{1},i_{2},ldots ,i_{n}}} 是一组 n {displaystyle n} 称为项目的二进制属性。

设 D = { t 1 , t 2 , … , t m } {displaystyle D={t_{1},t_{2},ldots ,t_{m}}} 是一组交易 称为数据库。

D {displaystyle D} 中的每个交易都有一个xxx的交易 ID,并包含 I {displaystyle I} 中的项目子集。

每条规则都由两组不同的项组成,也称为项集,X {displaystyle X} 和 Y {displaystyle Y} ,其中 X {displaystyle X} 称为前件或左手边( LHS) 和 Y {displaystyle Y} 结果或右侧 (RHS)。 前提是可以在数据中找到的项目,而结果是与前提组合时找到的项目。 陈述 X ⇒ Y {displaystyle XRightarrow Y} 通常被读作好像 X {displaystyle X} 然后 Y {displaystyle Y} ,其中先行词 ( X {displaystyle X} ) 是 if 和结果 ( Y {displaystyle Y} ) 是 then。 这只是意味着,理论上,只要 X {displaystyle X} 出现在数据集中,那么 Y {displaystyle Y} 也会出现。

过程

编辑

关联规则是通过在数据中搜索频繁的 if-then 模式并通过使用支持和置信度下的特定标准来定义最重要的关系是什么来制定的。 支持是一个项目出现在给定数据中的频率的证据,因为置信度由 if-then 语句被发现为真的次数定义。 但是,可以使用第三个标准,称为 Lift,可用于比较预期的 Confidence 和实际的 Confidence。 Lift 将显示 if-then 语句预计为真的次数。

关联规则是根据由两个或多个项目创建的项目集进行计算的。 如果规则是通过分析数据中所有可能的项目集而构建的,那么规则就会太多,以至于它们没有任何意义。 这就是关联规则通常由数据很好表示的规则制定的原因。

关联规则学习

您可以使用许多不同的数据挖掘技术来查找特定的分析和结果,例如,分类分析、聚类分析回归分析。 您应该使用哪种技术取决于您要使用数据寻找什么。 关联规则主要用于查找分析和对客户行为的预测。 对于分类分析,它很可能用于提问、决策和预测行为。 当没有对数据中的可能关系做出假设时,主要使用聚类分析。 回归分析用于预测来自多个独立变量的连续依赖值。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/249362/

(6)
词条目录
  1. 关联规则学习
  2. 定义
  3. 过程

轻触这里

关闭目录

目录