二元分类器的评价

1 二元分类器的评价

2 应变表

3 敏感性和特异性

二元分类器的评价

二元分类器的评价比较了两种分配二元属性的方法，其中一种通常是标准方法，另一种正在研究中。有许多指标可以用来衡量一个分类器或预测器的性能；不同的领域由于目标不同，对特定的指标有不同的偏好。例如，在医学上经常使用灵敏度和特异性，而在计算机科学上则倾向于使用精确度和召回率。一个重要的区别是独立于流行率（每个类别在人群中出现的频率）的度量和依赖于流行率的度量--这两种类型都很有用，但它们有非常不同的属性。

应变表

编辑

给定一个数据集，一个分类（分类器在该数据集上的输出）给出两个数字：阳性数和阴性数，这两个数字加起来就是该数据集的总规模。为了评估一个分类器，人们将其输出与另一个参考分类进行比较--理想情况下是一个完美的分类，但实际上是另一个黄金标准测试的输出--并将数据交叉表列成一个2×2的或然率表，比较这两个分类。然后，通过计算这4个数字的汇总统计，评估相对于黄金标准的分类器。一般来说，这些统计数字将是规模不变的（将所有的数字按相同的系数缩放不会改变输出），以使它们独立于人口规模，这是通过使用同质函数的比率来实现的，最简单的是同质线性或同质二次函数。假设我们测试一些人是否患有某种疾病。其中一些人患有这种疾病，而我们的测试正确地说他们是阳性。他们被称为真阳性（TP）。有些人有这种疾病，但测试错误地声称他们没有。他们被称为假阴性（FN）。有些人没有患病，但测试结果显示他们没有患病，这就是真阴性（TN）。最后，可能有健康人的测试结果为阳性--假阳性（FP）。这些都可以排列成一个2×2的或然率表（混淆矩阵），传统上，测试结果在纵轴上，实际情况在横轴上。然后，这些数字可以被加总，产生一个总和和边际总数。对整个表格进行合计，真阳性、假阴性、真阴性和假阳性的数量加起来是这组数据的xxx。将各列合计（垂直相加），真阳性和假阳性的数量加起来是测试阳性的xxx，同样，阴性也是如此。

将行相加（水平相加），真阳性和假阴性的数量相加为条件阳性的xxx（反之为阴性）。基本的边际比率统计是通过将表中的2×2=4个值除以边际总数（行或列）得到的，产生2个辅助的2×2表，总共有8个比率。这些比率有4个互补对，每对的总和为1，因此这些衍生的2×2表格中的每一个都可以被总结为一对2个数字，连同它们的互补对。通过取这些比率的比值、比率的比值或更复杂的函数，可以得到进一步的统计数据。现将或然率表和最常见的派生比率总结如下；详情见续集。请注意，行对应于条件实际为阳性或阴性（或被黄金标准归类为阳性），如颜色编码所示，相关的统计数字是与患病率无关的，而列对应于测试为阳性或阴性，相关的统计数字是与患病率有关。预测值也有类似的似然比，但这些都是不太常用的，上面也没有描述。

敏感性和特异性

编辑

与流行率无关的基本统计数字是敏感性和特异性。敏感性或真阳性率（TPR），也称为召回率，是指测试为阳性的人（真阳性，TP）占所有实际为阳性的人（条件阳性，CP=TP+FN）的比例。它可以被看作是在病人患病的情况下，测试呈阳性的概率。灵敏度越高，未被发现的实际疾病病例就越少（或者，在工厂质量控制的情况下，进入市场的故障产品就越少）。特异性（SPC）或真阴性率（TNR）是指检测为阴性且为阴性的人（真阴性，TN）占所有实际为阴性的人（条件阴性，CN=TN+FP）的比例。与敏感性一样，它可以被看作是在病人没有生病的情况下，检测结果为阴性的概率。特异性越高，被贴上疾病标签的健康人就越少（或者，在工厂的情况下，被丢弃的好产品就越少）。特异性之间的关系

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/175612/