项目反应理论在医学量表条目筛选中的应用

项目反应理论在医学量表条目筛选中的应用

ID:9659985

大小:53.00 KB

页数:4页

时间:2018-05-04

项目反应理论在医学量表条目筛选中的应用_第1页
项目反应理论在医学量表条目筛选中的应用_第2页
项目反应理论在医学量表条目筛选中的应用_第3页
项目反应理论在医学量表条目筛选中的应用_第4页
资源描述:

《项目反应理论在医学量表条目筛选中的应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、项目反应理论在医学量表条目筛选中的应用项目反应理论在医学量表条目筛选中的应用条目筛选是量表编制及简化工作中不可缺少的部分,选择好的筛选方法、恰当的评价指标及筛选好的条目是保证最终量表具有较好的信度和效度的重要过程。目前条目筛选的方法主要包括经典测量方法(CTT)和项目反应理论(itemresponsetheory,IRT)方法。CTT,比如相关系数法、因子分析法、克朗巴赫系数法、重测信度法等[1-2],因其理论较成熟,数学模型简单,在国内得到广泛的应用。然而它在理论假设和实际应用方面也存在许多不足,如潜变

2、量与观测变量之间通常不是线性关系,项目参数严重依赖于被试样本,只提供平均测量信度等。IRT的发展克服了上述缺陷[3]。与CTT相比,IRT具有下列优点:①被试者的能力估计不依赖于量表条目;②项目参数(区分度和难度)估计不依赖于被试样本;③用信息函数的概念代替了CTT的信度理论,可以提供条目信息量及不同能力水平对应的测量信度。IRT是20世纪50年代发展起来的一种心理与教育测量理论,主要用于试题、量表条目的筛选和评价,在西方国家发展很快,但在国内用于医学研究本文由.L.收集整理的很少,因此,本文介绍IRT的

3、基本特征及其在医学量表的项目分析中的应用。  1IRT的基本介绍  IRT是一系列心理统计学模型的总称。美国心理测量学家Lord于1952年提出著名的累积正态模型(normalogivemodel)标志着IRT的正式诞生。IRT对所测量的项目可以找到一条项目特征曲线(ICC),通过被试者对项目的反应与其潜在特质之间的关系用一单调递增的项目反应函数来估计被试者的能力水平。ICC是IRT的基础,两个常用的参数(区分度和难度)决定了它的形状,常为一条S型曲线,见图1。难度参数(b,也称阈值参数)是指被试者按给定

4、方向选择某个选项的概率为50%所对应的潜在能力点;难度参数越大,被试者选择这个选项需要的能力就越大。区分度参数(a)是指难度参数对应的ICC曲线拐点的斜率。区分度参数越大,表示条目对不同潜在特质水平的人群有越高的区分能力。三参数模型还可以估计伪机遇参数(c),在考试中,c的估计可以提高能力估计的精度,但在健康研究中,估计c的意义不大,反而增加了参数估计的复杂性。对于多级记分模型,不同模型的难度参数概念略有不同,它们的原理都是将k个选项的条目分成(k-1)个二分类条目,故有(k-1)个阈值参数。在ICC的基

5、础上,IRT还可以产生类别反应曲线(CRCs),它表示每个反应选项在特定能力水平下被选择的概率,因此,每个选项都有一条相应的类别反应曲线,如图2为一个5分类条目的CRCs,若条目基于分部评分模型,则相邻两个类别反应曲线的交点可作为这个条目的阈值参数。  图1项目反应曲线  IRT的另一个重要特征就是信息函数,它是潜在能力θ的一个连续函数。对具有同一能力θ的一组被试,其能力估计值的标准误差越小,估计值对真实值提供的信息量就越大,当用极大似然法估计θ时,估计量随样本量的增大

6、而渐近正态分布,则测验信息函数可以定义为能力估计值的方差的倒数,即I(θ)=1/var(θ)或者SE(θ)=1/■。测验信息与测量误差是一一对应的,信息量越大,测量精度越高,信息量最大值所对应的能力水平代表该条目所能最精确测量到的能力参数估计值。若记项目信息函数为Ii(θ),n个条目的信息累加,则可产生测验信息函数,其数学表达式为I(θ)=■Ii(θ)。可见,每个条目可以单独对量表总信息作贡献,贡献量大小不受量表其它条目的影响,因此可

7、以为增加或者删除条目提供依据。2IRT在条目筛选中的应用  2.1IRT模型的选择  IRT模型是建立在强假设的基础上,若假设不成立,则可能导致得到的结果不能很好地解释数据信息。因此,选择适当的模型是很重要的。IRT有单维、多维的参数模型及非参数模型等多种模型,由于后两种模型较复杂且应用少,本文主要介绍单维的参数模型[3-4]。选择模型时,需要考虑条目的选项个数、模型参数及参数是否受到限制等问题,表1总结了8种模型的主要特征。  目前IRT的参数估计方法很多,大多数方法是以极大似然估计法和Bayes估计法

8、为基础,其中极大似然估计法的应用最广泛。目前对于PCM、GPCM、GRM等模型的选择没有明确的标准,主要根据个人的偏好或者对软件的熟悉程度选择其中一个模型。比如Rumm、Parscale、的估计,而Multilog软件多用于GRM的估计。  2.2评价IRT模型的拟合情况  2.2.1考察模型假设IRT的应用有两个基本的假设[3]:单维性和局部独立性。前提假设满足的程度越高,越能体现IRT模型应用的有效性。①单维性是指量表或者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。