类别效用
编辑类别效用是Gluck&Corter(1985)和Corter&Gluck(1992)中定义的对类别良好性的一种测量。它试图使同一类别中的两个物体具有共同属性值的概率和不同类别的物体具有不同属性值的概率都达到xxx。它的目的是取代更有限的类别良好性措施,如线索有效性(Reed1972;Rosch&Mervis1975)和搭配指数(Jones1983)。它提供了一个规范的信息理论测量,即拥有给定类别结构(即实例的类标签)知识的观察者比不拥有类别结构知识的观察者所获得的预测优势。在这个意义上,类别效用测量的动机类似于决策树学习中使用的信息增益度量。在某些表述中,它在形式上也等同于互信息,如下文所述。Witten&Frank(2005,pp.260-262)对类别效用的概率化身进行了回顾,并将其应用于机器学习。
类别效用的概率理论定义
编辑Fisher(1987)和Witten&Frank(2005)中给出的类别效用的概率理论定义如下。{displaystylep(f_{ik}|c_{j})}指定类别条件概率。指定特征的类别条件概率为{displaystylef_{i}}指定特征fi的类别条件概率。{displaystyletextstyle{tfrac{1}{p}}的作用。}作为一种粗略的过拟合控制,已在上述资料中给出。宽泛地说(Fisher1987),术语{displaystyletextstylep(c_{j})sum_{f_{i}inF}sum_{k=1}{m}p(f_{ik}){2}}。是指观察者在没有任何类别标签知识的情况下,采用相同的策略,可以正确猜出的属性值的预期数量。因此,它们之间的差异反映了观察者因拥有类别结构的知识而获得的相对优势。
类别效用的信息论定义对于一组有大小的实体来说,类别效用的信息论定义为{displaystylec}是一个实体属于正面类别的先验概率。(在没有任何特征信息的情况下)。{displaystylep(f_{i}|{bar{c}})}是实体具有特征的条件概率。同样是一个实体具有特征的条件概率{displaystylef_{i}}是实体具有特征fi的条件概率。鉴于该实体属于类别{displaystylep(f_{i})}是实体的先验概率。是一个实体po的先验概率
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175516/