信度

编辑
本词条由“匿名用户” 建档。
在统计学和心理测量学中,可靠性是衡量指标的整体一致性。 如果一项措施在一致的条件下产生相似的结果,则称该措施具有高可靠性: 一组测试分数的特征与可能嵌入分数中的测量过程的随机误差量有关。 高度可靠的分数是精确的、可重现的,并且从一个测试场合到另一个测试场合都是一致的。 也就是说,如果对一组测试者重复测试过程,将获得基本相同的结果。 各种信度系数,取值范围在0.00(误差很大)和1.00(...

信度

编辑

在统计学和心理测量学中,可靠性是衡量指标的整体一致性。 如果一项措施在一致的条件下产生相似的结果,则称该措施具有高可靠性:

一组测试分数的特征与可能嵌入分数中的测量过程的随机误差量有关。 高度可靠的分数是精确的、可重现的,并且从一个测试场合到另一个测试场合都是一致的。 也就是说,如果对一组测试者重复测试过程,将获得基本相同的结果。 各种信度系数,取值范围在0.00(误差很大)和1.00(无误差)之间,通常用来表示分数的误差大小。

例如,人们身高和体重的测量结果往往非常可靠。

类型

编辑

有几个一般类别的可靠性估计:

  • 评分者间的信度评估两个或更多评分者在他们的评估中的一致性程度。 例如,一个人胃痛,不同的医生都给出相同的诊断。
  • 重测信度评估一次考试与下一次考试成绩的一致性程度。 测量结果是从使用相同方法或仪器以及相同测试条件的单个评估者那里收集的。 这包括评估者内部的可靠性。
  • 方法间信度评估的是当所用方法或仪器发生变化时测试分数的一致性程度。 这允许排除评估者间的可靠性。 在处理表格时,它可以称为平行表格可靠性。
  • 内部一致性可靠性,评估测试中各项目结果的一致性。

有效性的区别

编辑

可靠性并不意味着有效性。 也就是说,一个可靠的衡量标准是始终如一地衡量某事,但不一定衡量你想衡量的东西。 例如,虽然有许多针对特定能力的可靠测试,但并非所有测试都可以有效预测工作表现等。

虽然可靠性并不意味着有效性,但可靠性确实限制了测试的整体有效性。 一个不完全可靠的测试不可能完全有效,无论是作为衡量一个人属性的手段还是作为预测标准分数的手段。 虽然可靠的测试可以提供有用的有效信息,但不可靠的测试不可能是有效的。

例如,如果一组称重秤始终测量物体的重量为真实重量的 500 克,那么秤将非常可靠,但它不会有效(因为返回的重量不是真实重量)。 为了使秤有效,它应该返回物体的真实重量。 这个例子表明,一个完全可靠的度量不一定有效,但一个有效的度量必然是可靠的。

通用模型

编辑

在实践中,测试措施永远不会完全一致。 已经开发了测试可靠性理论来估计不一致性对测量准确性的影响。 几乎所有考试信度理论的基本出发点都是考试成绩反映了两种因素的影响:

1. 有助于一致性的因素:个人的稳定特征或一个人试图衡量的属性。

2. 导致不一致的因素:个人或情况的特征可能会影响考试成绩,但与被测属性无关。

这些因素包括:

  • 个人的暂时但普遍的特征:健康、疲劳、动力、情绪紧张
  • 个人的临时和特定特征:对特定测试任务的理解、处理特定测试材料的特定技巧或技巧、记忆力、注意力或准确性的波动
  • 测试情况的各个方面:不受干扰、指示清晰、个性互动等。
  • 机会因素:通过纯粹的猜测、一时的分心来选择答案的运气

估计可靠性的目标是确定测试分数的可变性有多少是由于测量误差造成的,有多少是由于真实分数的可变性造成的。

信度

真实分数是被测概念的可复制特征。 它是观察到的分数的一部分,在没有错误的情况下会在不同的测量场合重复出现。

测量误差由随机误差和系统误差组成。 它表示测试中获得的分数与相应的真实分数之间的差异。

这种概念分解通常由简单的等式表示:

实测分数 = 真实分数 + 测量误差

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/204102/

(4)
词条目录
  1. 信度
  2. 类型
  3. 有效性的区别
  4. 通用模型

轻触这里

关闭目录

目录