规则提取系统家族

编辑
本词条由“匿名用户” 建档。

规则提取系统(RULES)家族是一个归纳学习的家族,包括几个覆盖算法。这个系列被用来建立基于给定观察的预测模型。它的工作原理是基于分离与征服的概念,从给定的训练集直接诱导出规则并建立其知识库。RULES家族的算法通常在数据挖掘工具中可用,比如KEEL和WEKA,它们以知识提取和决策而闻名。概述RULES家族的算法主要用于数据挖掘,以创建一个模型,预测给定输入特征的行动。它属于归纳学习的范畴,是一种...

规则提取系统家族

编辑

规则提取系统(RULES)家族是一个归纳学习的家族,包括几个覆盖算法。这个系列被用来建立基于给定观察的预测模型。它的工作原理是基于分离与征服的概念,从给定的训练集直接诱导出规则并建立其知识库。RULES家族的算法通常在数据挖掘工具中可用,比如KEEL和WEKA,它们以知识提取和决策而闻名。概述RULES家族的算法主要用于数据挖掘,以创建一个模型,预测给定输入特征行动。它属于归纳学习的范畴,是一种机器学习方法。在这种类型的学习中,通常向xxx提供以前的信息,以获得基于给定历史数据的描述性知识。因此,它是一种有监督的学习范式,作为一种数据分析工具,它使用通过训练获得的知识来得出一般结论,并使用产生的分类器来识别新对象。归纳学习曾被分为两种类型:决策(DT)和覆盖算法(CA)。决策树根据分而治之的概念发现规则,而CA则根据分而治之的概念直接从训练集诱导出规则。尽管DT算法在过去的几十年里得到了广泛的认可,但CA由于其直接的规则归纳特性而开始吸引人们的注意,正如Kurgan等人所强调的那样[1]。在这种类型的归纳学习方法下,已经开发并改进了几个系列。RULES系列[2],被称为规则提取系统,是覆盖算法的一个系列,在诱导最佳规则时将每个实例或例子分开。在这个系列中,产生的规则被存储在一个"IF条件THEN结论"的结构中。它有自己的归纳程序,用于诱导最佳规则和建立知识库。

归纳程序

编辑

为了根据给定的观察结果诱导出最佳规则,RULES家族开始选择(分离)一个种子例子,以逐个条件建立规则。覆盖最多正面例子和最少负面例子的规则被选为当前种子例子的最佳规则。它允许最佳规则覆盖一些负面的例子,以处理增加灵活性和减少规则归纳中的过拟合问题和噪声数据。当覆盖率达到指定的阈值时,它就会标记与诱导出的规则相匹配的例子而不删除。这就避免了重复发现相同的规则,同时也保留了覆盖精度和新规则的通用性。之后,重复该算法来选择(征服)另一个种子例子,直到所有的例子都被覆盖。因此,每一步只能生成一条规则。

规则提取系统家族的算法

编辑

在RULES系列中已经提出了几个版本和算法,可以总结如下。RULES-1[3]是RULES系列的xxx个版本,由Prof.Pham和Prof.RULES-2[4]是RULES-1的升级版,其中每个例子都是单独研究的。RULES-3[5]是另一个版本,包含了RULES-2的所有属性以及其他附加功能,以生成更多的通用规则。RULES-3Plus[6]是RULES-3的扩展版本,有两个附加功能。RULES-4[7]是RULES家族中xxx个增量版本。RULES-5[8]是xxx个处理连续属性而没有离散化的RULES版本。RULES-6[10]是RULES家族的一个可扩展版本,是RULES-3plus的延伸.RULES-F[11]是RULES-5的延伸,它不仅处理连续属性,还处理连续类.RULES-SRI[12]是另一种可扩展的RULES算法,是为了提高RULES-6的可扩展性而开发的。

规则提取方法

规则提取器-1(REX-1)[13]是对RULES-3,RULES-3Plus,和RULES-4的改进,以缩短处理时间,并以较少的规则产生更简单的模型。RULES-IS[14]是一个受免疫系统启发的增量算法。RULES-3EXT[15]是RULES-3的扩展,具有额外的功能。RULES-7[16]是RULES-6的扩展,它一次对一个种子进行专业化处理.RULES-8[17]是一个改进的版本,可以在线处理连续属性.RULES-TL[18]是另一个可扩展的算法,被提出来提高性能速度,同时引入更多的智能方面.RULES-IT[19]是一个增量版本,基于RULES-TL建立,可以增量处理大型和不完整问题.应用覆盖算法。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175406/

(1)
词条目录
  1. 规则提取系统家族
  2. 归纳程序
  3. 规则提取系统家族的算法

轻触这里

关闭目录

目录