项目反应理论与经典测验理论之比较.pdf

项目反应理论与经典测验理论之比较.pdf

ID:52429809

大小:243.46 KB

页数:4页

时间:2020-03-27

项目反应理论与经典测验理论之比较.pdf_第1页
项目反应理论与经典测验理论之比较.pdf_第2页
项目反应理论与经典测验理论之比较.pdf_第3页
项目反应理论与经典测验理论之比较.pdf_第4页
资源描述:

《项目反应理论与经典测验理论之比较.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、南京师大学报(社会科学版)1998年第4期项目反应理论与经典测验理论之比较俞晓琳摘要本文介绍了项目反应理论(IRT)与经典测验理论(CTT)的主要内容,就两者的优缺点展开讨论,并对它们的应用前景作一预测分析。关键词项目反应理论经典测验理论心理测验心理测验是测量人的心理特质的主要方法之把测验的得分(通常称为测验的观察分)看作真分数一。随着心理学的日益科学化,对心理测验的要求也和误差分数的线性组合,可归结为如下简单数学模越来越高。这需要心理测验理论不断更新与发展。型:X=T+eX是观测分数,T是真分数,e是误差

2、心理测验理论是对心理测验中诸如误差、样本分。传统信度、效度、项目分析的原理与方法均建立容量、测量单位等问题进行研究,并设计方法加以解在这一模型之上。决的理论研究。它与心理学的发展紧密相联。心理学IRT虽然在国外发展很快,但在国内研究不多,中的个别差异的研究引起了心理测验运动,高尔顿、因此对多数心理学工作者来说是比较陌生的,其基卡特尔、皮尔逊等人对此作出了杰出的贡献。在此研本思想与心理学中关于潜在特质的一般理论有关。究基础上,本世纪初,斯皮尔曼发表了《认知的规律它是假设被试对测验的反应受某种心理特质(因其和智

3、慧的本质》与《人类的能力》等文,提出因素分析无法直接测量,称为潜在特质)支配,于是我们就可的方法后,经典测验理论CTT(ClassicTestTheory)对这种特质进行界定。IRT然后估计出该被试这种研究开始蓬勃发展,至今已有九十余年。特质的分数,并根据其高低来预测、解释被试对项目CTT主要是指真分数理论,虽然它是编制心理或测验的反应。因此IRT主要在于建立各种与数据测验常用的方法,而且在不断地完善自身,但作为一拟合的模型-确定被试的潜在特质值和他们对于项种理论,其不足之处不是修修改改就能够解决的。针目的

4、反应之间的关系。对这些,现代测验理论应运而生。在项目分析部分,CTT是建立在弱假设基础上的,IRT则建立在主要出现了项目反应理论IRT(ItemResponseThe-强假设基础上的。后者有三条基本假设:潜在特质空ory)。美国测量专家洛德1952年在其博士论文中首间的单维性假设-指组成某个测验的所有项目都是次提出了项目反应模型,即双参数正态卵形模型,并测量同一潜在特质;局部独立性假设-指对某个被提出了与此相关的参数估计方法,使得IRT可被用试能力而言,项目间无相关存在;项目特征曲线假设于解决实际的二值记分

5、的测验问题。它标志着IRT则是对被试某项目的正确反应概率与其能力之间的的正式诞生。在这之后,IRT得到了充分发展,尤其函数关系所作的模型。IRT有各种各样的模型,其中七、八十年代在大多数发达国家得到测量专家的关著名的是二级评分模型中的单参数逻辑斯蒂模型注,在心理学研究中的使用频率大幅度上升,超过经(即拉什模型)和三参数逻辑斯蒂模型,后者有项目典理论和概化理论。IRT解决了CTT未能解决的许难度、项目区分度、猜测三个参数。只要找到适合数多问题,但其本身也有许多缺点,阻碍其推广。本文据的模型,就可以对项目进行比

6、较精确的分析。拟对CTT与IRT(尤其后者)进行概括介绍,比较两二、CTT之不足与IRT之优点者之长短,并对它们的运用前景作一简要预测。CTT经过长期的发展,在理论与实践上都有公一、CTT与IRT的主要内容认的成就,但仍存在许多无法克服的技术问题。在这CTT是心理学研究者所熟悉的,其基本思想是些方面,IRT却有较大的突破。这里就CTT的缺点,—74—结合IRT的解决方法,对两者进行比较。被试的不同水平,对不同的被试实施不同的测验项首先,CTT依据其项目分析法所得的项目统计目,并使这些项目的难度和被试的水平相

7、适应。其方量受样本的抽样变动影响大。即项目统计量依赖于法是先给被试呈现一道中等难度的项目,根据被试测验所实施的被试样组。CTT中项目统计量主要是的反应情况(答对或答错),再从题库中选择下一个项目难度(P值)和项目鉴别力(D值或项目得分与项目呈现给被试。可以采用固定分枝或灵活分枝等测验总分的相关系数)。项目难度P=R/N是答对该多种方法选择和被试能力相适应的项目。在这种情项目的被试比率。如果抽取的样本中,能力高的被试况下,被试能力当然就很容易比较了。适性测验另一多,那么R值就高,P值也随之增高;若抽取的样本优

8、点是,能力高的被试不会要求回答低难度的项目,中,能力低的被试多,P值就会降低。在以D值为项于是增加了挑战性;而能力低的被试又不会由于要目鉴别力的项目分析中,如果样本同质,那么被试能求回答高难度的项目而失去信心。力高低差不多,高分组与低分组答对项目的比例就测验独立被试测量,是指被试能力的测量不依会相差无几,D值就小;若样本异质,D值就会大。以赖于所选择的测验的难度,因此不管何种难度的测相关系数为鉴别力也是一样的情况

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。