资源描述:
《CTT与IRT测量原理之比较_沐守宽.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2006年月上海师范大学学报基础教育版,总第卷第期,司卿,中图分类号文献标识码文章编号一《侧〕一侧拓一与测量原理之比较沐守宽上海师范大学教育学院,上海摘要通过对经典测量理论与项目反应理论在基本假设、测验精度计量、测验的标准误以及测验项目的筛选等四个主要领域的比较,可以发现项目反应理论具有被试能力估计的项目选择独立性、项目难度参数与能力参数的刻度统一性、项目参数估计的样本独立性、估计测量误差的精确性等几个优点但是在某些模型中存在单维性假设难以满足、侧验条件要求严格以及数学模型简约性差等需要解决的问题。关键词经典测量理论项目反应理论参数在心理学的应用领域,心理测量学一直处
2、于助与出版《心理测验分数的举足轻重的地位。直到今天,世纪早期依靠经统计理论》一书,标志着走向成熟。被解典测量理论叮,简称竹发展释为在界定潜在特质后,个体的行为可出来的智力测验量表和人格测量量表,像韦克斯以被证实其真实的程度,依据这些特质估计个体勒儿童智力量表、成人量表、卡特的能力,而且可以依据获得的特质水平解释或预尔种人格因素测验、明尼苏达多相人测个体在相关情境下的表现。采用非线性函格调查量表等许多经典量表经过多次多数,把被试的潜在特质水平和项目难度定义在同版本修订,仍然广泛应用于教育教学、临床诊断、一刻度上,运用概率模型对被试的潜在特早期发展诊断、人员选拔和人力资源
3、管理等诸多质能力和项目参数进行估计,衍生出大量的测量领域。然而,心理测量学的基础已经发生了巨大模型,解决不同的测量数据结构问题。本文拟对的变化,件经过几十年的发展建立了完备的理与的测量原理加以比较,并说明的论体系,标准化测验趋势和越来越多的潜在的测优越之处。验问题是竹无法解决的,项目反应理论一、测验的基本假设不同砂,简称应运而生,像、与的最大不同是两者的基本假设不大规模考试都是运用来解决考试标准同。竹的基本假设是真分数假设,即二化问题的。收稿日期一一作者简介沐守宽一,男,安徽定远人,上海师范大学教育学院博士研究生,主要从事心理测量与差异心理研究。沐守宽与测量原理之比较
4、,而且和之间相互独立,即川,,只测量被试的一个潜在特质,反过来说,被试对某£,,£平行测验假设,即满足拼,拼个项目的反应只受到一种潜在特质的支配,而不受其他潜在特质的影响。早期发展出来的模型大·`'沁仍',,二一犷,也就是说两种或若干种测验形式测量的特质一样,如果测量的平均数多基于这个假设,比如被试对简单容易项目的反相等,方差也相等,就是平行测验应就满足单维性假设要求但在实际测量过程中,甚至提出外部变量的协方差也要等值。被试对较复杂困难项目的反应往往受到几种潜在然而,实际的测验平行是不可能满足的,不同形式特质的影响,不过现在大多假定被试对某一项目测验的平均数和方差总会
5、有些不同,常用线性等的反应主要为一种潜在特质所决定。值和百分等值技术对不同形式测验加以等值,不与认为,当测验结果受到一个主要因同形式的测验虽然可以等值,等值误差却难以控素而影响时,则符合单维性假设。制,测验难度水平差异越大,等值误差越大。信度另外,也发展出多维线性模型来解决多维潜高且分数分布形态相似的测验最适合等值计算。在特质决定项目反应问题,当然这也是建立在被这个假设通常被认为是“强假设”,要想满足要求试对某一项目的反应确实是因为需要多种潜在特是很困难的。中若干指标如信度、效度等质的基础上。因此,不同模型对单维性假设的要的计量正是建立在这两个基本假设基础上的。求是变
6、通的,有时单维性假设就成了选择测量模的基本假设主要有知道—正确假型的条件。可以说,单维性假设是一个“弱设卜流一,如果被试知道项假设”。目,也译作题目的正确答案,被试将做出正用线性函数来描述真分数、观测分数与确反应,如果被试做出错误反应,被试则可以推断观测分数之间的关系,显然把心理测量等同于物不知道项目的正确答案。但是被试做出正确反理测量,违背了人的心理活动是客观现实在人脑应,并不意味着被试一定知道项目的正确答案,比中的反映以及心理活动的能动性、非线性、自我建如在选择题的正确反应中常常存在猜测因素,二构的特性。可以说,的真分数模型不符合心值项目的三参数逻辑斯蒂模型与三参
7、数正态卵形理内容的实质。采用非线性函数,把被试的模型均引人猜测参数对被试的项目正确反应概率潜在特质水平和项目难度定义在同一刻度加以度量。局部独立性假设功上,运用概率模型对被试的潜在特质能力,所谓局部独立包括被试间独立和项目间独进行估计,如模型,`口,口`立,通常不同被试对相同项目的反应是相互独立一月`其中,月`分别为被试的潜在特的,称为被试间独立,即某被试对某项目的正确反呷一刀`'应概率不依赖于其他被试对该项目的正确反应概质水平、项目的难度。因此,项目的难度大小一般率而被试对不同项目的反应是相互独立的,称为不会影响被试潜在特质水平的估计,不同被试的项