资源描述:
《人才测评的信度与效度》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十章、人才测评的信度与效度人才测评的核心价值在于预测的有效性预测好预测不好实际好实际不好正确接受错误接受正确拒绝错误拒绝在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。X=T+B+ET表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。一、
2、信度测试信度(testreliability)也叫测试的可靠性,指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0,就认为测量是完全可信的,信度最高。信度评估的方法(一)重测信度,又称为稳定性系数,它的计量方法是采用重测法:用同一测验,在不同时间对
3、同一群体施测两次,这两次测量分数的相关系数即为重测系数。重测信度所考察的误差来源是时间的变化所带来的随机影响。在评估重测信度时,必须注意重测间隔的时间。对于人格测验,重测间隔在两周到6个月之间比较合适。在进行重测信度的评估时,还应注意以下两个重要问题:⑴重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化。⑵不同的行为受随机误差影响不同。(二)复本信度,是以两个测验复本来测量同一群体,然后求得应试者在这两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验
4、互为复本。计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。复本信度也考虑两个复本实施的时间间隔。复本信度的主要优点在于:⑴能够避免重测信度的一些问题,如记忆效果、练习效应等;⑵适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响;⑶减少了辅导或作弊的可能性。☆复本信度的局限性在于:⑴如果测量的行为易受练习的影响,则复本信度只能减少而不能消除这种影响;⑵有些测验的性质会由于重复而发生改变;⑶有些测验很难找到合适的复本。(三)内部一致性信度,主要反映的是测验内部题目之间的关系,考察测验的各
5、个题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。分半信度系数是通过将测验分成两半,计算这两半测验之间的相关性而获得的信度系数。测验愈长,信度系数愈高。同质性信度是指测验内部的各题目在多大程度上考察了同一内容。同质性信度低时,即使各个测试题看起来似乎是测量同一特质,但测验实际上是异质的,即测验测量了不止一种特质。同质性分析与项目分析中的内部一致性分析相类似。(四)评分者信度,是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求
6、每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。提高测验信度的方法影响测验信度的误差归纳起来主要有:(1)抽样误差:简单说,这是在抽样过程中由于被试间的差异所造成的误差。被试间的差异可以用全距和方差大小来表示。全距是指某一心理量最大值与最小值之差。全距大说明被试间差异大,全距小说明被试间差异小。被试间在某一心理量上参差不齐,差别悬殊,则该心理量的方差大;反之,方差小。对于方差小的样本,被试间在某一心理特征上相差较小,则前后两次测验结果的一致性较低,即降低了
7、信度。因为被试之间的差别越小其同质性越高,被试的分数只要发生小的变化,其名次就可能改变,从而降低信度。(2)随机误差:由于各种偶然因素的影响而产生的误差,表现为用同一方法多次测量同一对象时结果上不一致。随机误差是由许多因素造成的,如量标的质量,测量的程序,被试的身心状态,测量的环境等。根据影响测验信度的因素,可从以下几方面来提高测验的信度:一是从测验本身考虑,如测验的长度、难度、区分度、速度、程序、环境条件与计分方法等;一是从被试自身考虑,如被试在被测心理特征上的差异大小,参加测验的动机水平,对测验的态度和积极
8、性等。在此主要介绍如下几种提高测验信度的方法:(1)适当延长测验的长度:测验的长度主要指量表所包含的题目多少。对一个测验来说,测验的题目越少,得分越容易受偶然因素的影响,故测验的信度越低。反之如果测验题目较多,即测验长度延长,扩大了被试得分范围,可在一定程度上排除偶然因素的影响,从而提高测验信度。但是测验信度的增加并不是等比例提高信度系数。当信度系数较小时,延长测验长度信度系数增加较大