二元分类器的评价
编辑二元分类器的评价比较了两种分配二元属性的方法,其中一种通常是标准方法,另一种正在研究中。有许多指标可以用来衡量一个分类器或预测器的性能;不同的领域由于目标不同,对特定的指标有不同的偏好。例如,在医学上经常使用灵敏度和特异性,而在计算机科学上则倾向于使用精确度和召回率。一个重要的区别是独立于流行率(每个类别在人群中出现的频率)的度量和依赖于流行率的度量--这两种类型都很有用,但它们有非常不同的属性。
应变表
编辑给定一个数据集,一个分类(分类器在该数据集上的输出)给出两个数字:阳性数和阴性数,这两个数字加起来就是该数据集的总规模。为了评估一个分类器,人们将其输出与另一个参考分类进行比较--理想情况下是一个完美的分类,但实际上是另一个黄金标准测试的输出--并将数据交叉表列成一个2×2的或然率表,比较这两个分类。然后,通过计算这4个数字的汇总统计,评估相对于黄金标准的分类器。一般来说,这些统计数字将是规模不变的(将所有的数字按相同的系数缩放不会改变输出),以使它们独立于人口规模,这是通过使用同质函数的比率来实现的,最简单的是同质线性或同质二次函数。假设我们测试一些人是否患有某种疾病。其中一些人患有这种疾病,而我们的测试正确地说他们是阳性。他们被称为真阳性(TP)。有些人有这种疾病,但测试错误地声称他们没有。他们被称为假阴性(FN)。有些人没有患病,但测试结果显示他们没有患病,这就是真阴性(TN)。最后,可能有健康人的测试结果为阳性--假阳性(FP)。这些都可以排列成一个2×2的或然率表(混淆矩阵),传统上,测试结果在纵轴上,实际情况在横轴上。然后,这些数字可以被加总,产生一个总和和边际总数。对整个表格进行合计,真阳性、假阴性、真阴性和假阳性的数量加起来是这组数据的xxx。将各列合计(垂直相加),真阳性和假阳性的数量加起来是测试阳性的xxx,同样,阴性也是如此。
将行相加(水平相加),真阳性和假阴性的数量相加为条件阳性的xxx(反之为阴性)。基本的边际比率统计是通过将表中的2×2=4个值除以边际总数(行或列)得到的,产生2个辅助的2×2表,总共有8个比率。这些比率有4个互补对,每对的总和为1,因此这些衍生的2×2表格中的每一个都可以被总结为一对2个数字,连同它们的互补对。通过取这些比率的比值、比率的比值或更复杂的函数,可以得到进一步的统计数据。现将或然率表和最常见的派生比率总结如下;详情见续集。请注意,行对应于条件实际为阳性或阴性(或被黄金标准归类为阳性),如颜色编码所示,相关的统计数字是与患病率无关的,而列对应于测试为阳性或阴性,相关的统计数字是与患病率有关。预测值也有类似的似然比,但这些都是不太常用的,上面也没有描述。
敏感性和特异性
编辑与流行率无关的基本统计数字是敏感性和特异性。敏感性或真阳性率(TPR),也称为召回率,是指测试为阳性的人(真阳性,TP)占所有实际为阳性的人(条件阳性,CP=TP+FN)的比例。它可以被看作是在病人患病的情况下,测试呈阳性的概率。灵敏度越高,未被发现的实际疾病病例就越少(或者,在工厂质量控制的情况下,进入市场的故障产品就越少)。特异性(SPC)或真阴性率(TNR)是指检测为阴性且为阴性的人(真阴性,TN)占所有实际为阴性的人(条件阴性,CN=TN+FP)的比例。与敏感性一样,它可以被看作是在病人没有生病的情况下,检测结果为阴性的概率。特异性越高,被贴上疾病标签的健康人就越少(或者,在工厂的情况下,被丢弃的好产品就越少)。特异性之间的关系
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175612/