经典测验理论与项目反应理论的对比研究.doc

经典测验理论与项目反应理论的对比研究.doc

ID:48892807

大小:59.00 KB

页数:4页

时间:2020-02-05

经典测验理论与项目反应理论的对比研究.doc_第1页
经典测验理论与项目反应理论的对比研究.doc_第2页
经典测验理论与项目反应理论的对比研究.doc_第3页
经典测验理论与项目反应理论的对比研究.doc_第4页
资源描述:

《经典测验理论与项目反应理论的对比研究.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、经典测验理论与项目反应理论的对比研究作者:郭庆科;…    文章来源:山东师大学报    点击数:1558    更新时间:2007-2-20摘要:经典测验理论(CTT)的主要缺点有:对测题难度、区分度及测验信度的估计依赖于被试组,对被试能力的估计依赖于所使用的测验题目,只提供平均测量精度等.而项目反应理论(IRT)则有参数不变性的优点,并能给出不同水平被试的测量精度.CTT有使用方便的优点,而IRT的理论体系尚需进一步完善.二者将互相促进,共同发展.关键词:测验理论;经典测验理论;项目反应理论1.经典测验理论(CTT)的缺

2、点与优点经典测验理论以随机抽样理论为基础,建立了简单的数学模型,研究表明,它在理论假设和实际应用方面存在如下缺点:①真分数与观测分数间存在线性关系的假定不符合事实.CTT假定真分数T、观测分数X和测验误差分数E间的关系可以用一个简单的线性函数X=T+E表示.但大量的研究表明,真分数与观测分数间的非线性关系更符合事实;②项目统计量(难度和区分度)严重依赖于被试样本.CTT的项目难度以通过率表示,因此被试样本能力高时项目通过率就高,反之则低;区分度通常以项目与总分的相关或高低能力组的通过率之差表示,两组能力差别大时,区分度就高,

3、反之则低;③对被试能力的估计依赖于测验题目的难度.在CTT中,被试能力与测题难度是相关的,参加不同难度的测验会得到不同的能力估计值,不同测验结果间难以进行比较;④测验信度建立在平行测验假设的基础之上.平行测验指内容相似,平均分、标准差及误差均相同的测验.但严格平行的测验是不存在的.即使同一测验在不同时间施测,测验分数也会产生较大变异;⑤测验信度的取值也依赖于被试样本.当样本能力水平的差异大时,测验分数的分布范围就大,计算出的信度值就高,而反之信度值就低;⑥误差与真分数独立的假设难以满足.CTT假定误差与真分数独立,即RTE=

4、0,这是不符合事实的.低能力的被试答题时一般会比高能力被试有更多的猜测,所以其测验误差分的大小及方差必然要大于高能力的被试;⑦信度是针对被试全体的,只代表平均测量精度.信度不能给出不同能力水平的准确测量精度,因而对如何提高不同能力水平的测量精度问题CTT显得无能为力;⑧对测验等值、适应性测验、标准参照性测验的编制等问题不能给以满意的解决.但应该看到CTT是体系上最成熟的,以其为基础的测验在各行各业得到了成功的应用,可以说,CTT是其他测验理论赖以产生的基石.在新的测验理论崛起的今天,CTT仍然占据着不可替代的地位.之所以如此

5、,是因为CTT有以下的优点:①建立在较简单的数学模型之上,易于被人理解和接受,且计算简便,容易推广;②理论假设较弱,对实施条件要求不严格,适用性广;③在多数情况下CTT是足够精确的,可以放心地应用.2.项目反应理论(IRT)的优点与不足随着计算机技术的发展,IRT得以迅速推广应用.目前一些大型的考试TOEEL、GRE等,都相继采用了以IRT为基础的计算机化适应性测验(CAT),一些传统的智力测验如比奈测验、韦氏智力测验、瑞文测验等也使用IRT作为分析的理论依据.IRT的前景是无可争议的.IRT在理论和方法上有以下优点:①采用

6、非线性模型,建立了被试对项目的反应(观察变量)与其潜在特质(潜变量)之间的非线性关系,这一点更符合事实;②对被试能力的估计不依赖于特定的测验题目.IRT将被试能力和测题难度放在同一量尺上进行估计,无论测验的难易,被试能力估计值不变,不同的测验结果可直接比较;③难度和区分度的估计值与被试能力无关.同一个测验项目,高能力和低能力被试的反应拟合同一条项目特征函数曲线(ICC),同一条ICC所对应的项目参数是唯一的;④测验信息函数的概念代替了信度理论,用测验对能力估计所提供的信息量的多少来表示测量的精度.这避免了平行测验的假定,并能

7、给出不同能力被试的测量精度;⑤根据项目信息量的大小来选择对能力估计精度最有增益的项目,使测验达到预先规定的满意的精度.对不同能力的被试实施不同测题,既提高了测量精度又缩短了测验长度;⑥对测验等值、适应性测验、标准参照性测验的编制等问题给出了满意的解决办法.IRT的理论体系构建于更复杂的数学模型之上,其概念和理论推导更加严谨,但应该看到,IRT也并不是完美的,其不足之处表现在以下几方面:①单维性假定难以满足.这是IRT受到攻击的最主要原因.单维性是指测验测量的是单一潜在特质,但严格的单维性是难以满足的.目前的现实问题是,单维性

8、需达到什么程度才能应用IRT,但这一标准的确定尚缺乏充分的理论依据;②目前IRT的应用仍以两级记分模型为主,且局限于单维反应模型,更高级的IRT模型尚处于理论上的探索阶段;③IRT建立在更复杂的数学模型之上,依赖更强的假设,计算复杂,不易被人掌握;④IRT对测验条件要求较严格,样本容量要大

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。