ROC曲线_全球百科

1 ROC曲线

2 基本概念

3 ROC空间

ROC曲线

接受者操作特征曲线或 ROC 曲线是一种图形绘图，说明二元分类器系统的诊断能力随其辨别阈值的变化而变化。

ROC 曲线是通过在各种阈值设置下绘制真阳性率 (TPR) 与假阳性率 (FPR) 来创建的。真阳性率也称为灵敏度、召回率或检测概率。误报率也称为误报概率，可以计算为 (1 − specificity)。 ROC 也可以被认为是作为决策规则 I 类错误函数的功效图（当性能仅根据总体样本计算时，它可以被认为是这些数量的估计量） . 因此，ROC 曲线是灵敏度或召回率作为 fall-out 的函数。一般来说，如果已知检测和误报的概率分布，则可以通过绘制累积分布函数（从 − ∞ {\displaystyle -\infty } 到判别阈值的概率分布下的面积）来生成 ROC 曲线 ) y 轴上的检测概率与 x 轴上虚警概率的累积分布函数。

ROC 分析提供了工具来选择可能的最佳模型并独立于（并在指定之前）成本上下文或类分布来丢弃次优模型。 ROC 分析以直接和自然的方式与诊断决策的成本/收益分析相关。

ROC 也称为相对操作特性曲线，因为它是两个操作特性（TPR 和 FPR）随着标准变化的比较。

基本概念

编辑

分类模型（分类器或诊断）是某些类/组之间实例的映射。由于分类器或诊断结果可以是任意的真实值（连续输出），分类器之间的边界必须由一个阈值来确定（例如，根据血压测量来确定一个人是否患有高血压）。或者它可以是一个离散的类标签，表示其中一个类。

考虑一个二分类预测问题（二元分类），其中结果被标记为正 (p) 或负 (n)。二元分类器有四种可能的结果。如果预测的结果是 p 并且实际值也是 p，那么它被称为真阳性（TP）；但是，如果实际值为 n，则称其为误报 (FP)。相反，当预测结果和实际值都为 n 时，就会出现真阴性（TN），而当预测结果为 n 而实际值为 p 时，就会出现假阴性（FN）。

ROC空间

编辑

列联表可以导出多个评估指标（请参阅信息框）。要绘制 ROC 曲线，只需要真阳性率 (TPR) 和假阳性率 (FPR)（作为某些分类器参数的函数）。 TPR 定义了在测试期间所有可用的阳性样本中出现了多少正确的阳性结果。

另一方面，FPR 定义了测试期间所有可用负样本中有多少不正确的正结果出现。

ROC 空间由 FPR 和 TPR 分别定义为 x 和 y 轴，它描述了真阳性（收益）和假阳性（成本）之间的相对权衡。由于 TPR 等同于灵敏度，而 FPR 等于 1 − 特异性，因此 ROC 图有时也称为敏感性 vs (1 − 特异性) 图。混淆矩阵的每个预测结果或实例代表 ROC 空间中的一个点。

最佳可能的预测方法将在 ROC 空间的左上角或坐标 (0,1) 中产生一个点。

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/249468/