IRT在量表(测验)编制上的应用.doc

IRT在量表(测验)编制上的应用.doc

ID:31830740

大小:328.00 KB

页数:34页

时间:2019-01-20

IRT在量表(测验)编制上的应用.doc_第1页
IRT在量表(测验)编制上的应用.doc_第2页
IRT在量表(测验)编制上的应用.doc_第3页
IRT在量表(测验)编制上的应用.doc_第4页
IRT在量表(测验)编制上的应用.doc_第5页
资源描述:

《IRT在量表(测验)编制上的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、目录前言--1第一章试题反应理论的概念与发展--2第一节试题反应理论的基本概念--2第二节试题反应理论与古典测验理论的比较--2第三节常见的IRT模式--6第四节IRT的基本假设--13第五节当代IRT的发展--14第六节IRT的应用--15第二章IRT在测验编制上的应用--19第一节测验(量表)设计原理--19第二节选择模式--21第三节估计受试者程度值--22第四节试题分析--25第五节测验讯息量与测量标准误--28第六节检视资料的符合性--29第七节以IRT编制测验的实例--3233前言试题反应理论(IRT)是测验领域中较新的技术

2、,它已经被应用在教育、心理、医疗等相关领域中,如国中基本学力测验、托福、GRE、GMAT考试,以及国外的一些人格量表与医学相关量表的编制。当代著名的计算机化适性测验(CAT)也必须仰赖IRT的理论与技术才能运作。本次工作坊的主要内容是以介绍IRT的概念与实务应用为主,上午的课程是先对IRT做基础概念的介绍,接着以生活品质量表与国中基本学力测验的发展为例,介绍IRT的基础应用,并有实际数据让学员上机操作,对于有量表发展需求者而言相当实用。下午是IRT的进阶课程,介绍IRT在多向度测验及计算机化适性测验上的应用,对于有兴趣发展人格量表、多元

3、性向测验等多向度测验,或是想发展计算机化适性测验的人而言是很适合的课程。33第一章、试题反应理论的概念与发展第一节试题反应理论的基本概念试题反应理论(itemresponsetheory;IRT)主要是用来描述试题特性(难度、鉴别度、猜测度)与受测者的能力(潜在特质)如何影响其答题反应的一种数学模式。最简单的IRT模式如下列公式(1)所示(Rasch,1960):,(1)其中qj为考生j的能力,bi是试题i的难度,而Pij是受测者答对某个题目标机率。在IRT的模式中,受试者在某个题目上的答对机率是同时受到受试者能力与试题难易度所影响;而

4、受试者在测验上的整体表现就是各题目答对机率的联合机率。藉由这个数学模式与联合机率的概念,我们就能根据受试者在各个题目上的答题反应来估计受试者的能力以及题目的难易度,并且让接受不同题目的受试者其能力可以互相比较。IRT其实是许多试题反应模式的总称,当代已经有许多IRT模式分别适用在许多不同的测验情境中。常见的IRT模式可以根据其所包含的试题参数数目来分,分为单参数的Rasch模式、二参数模式与三参数模式(Birnbaum,1968)。也可以依据计分型态来分,分成二元计分(dicotomous)与多元计分(polytomous)模式;或是依

5、据适用的作答方式来分,分成评定量尺(ratingscale)模式、部分计分(partialcredit)模式、名义量尺(nominalscale)模式等。第二节试题反应理论与古典测验理论的比较试题反应理论与传统测验理论(classicaltesttheory;CTT)的比较见表1-1所示(Embretson&Reise,2000;Hambleton&Swaminathan,1986)。大致可以从模式特性、试题参数特性、能力与分数量尺特性、测量精准度与应用等几个层面来看。1.模式特性:IRT33的模式是针对单一试题的作答反应所提出的数学模

6、式,在其模式中同时考量了受试者能力与试题特性对答对机率的影响,所以它是一种直接描述作答行为的模式。此外,IRT其实是许多试题反应模式的总称,这些IRT模式是分别依据各种不同计分方式与不同作答方式的测验情境所发展出来的。表1-1试题反应理论与传统测验理论的比较试题反应理论传统测验理论模式特性1.针对单一试题的作答反应所提出的数学模式。2.现有各种不同的IRT模式,适用于不同计分方式与作答方式的测验中。1.针对测验总分所提出的数学模式。2.各种不同计分方式与作答方式的测验都使用同一套模式。试题参数特性题目特性(参数)的估计不会受到试者能力所

7、影响。题目特性(参数)的估计会受到试者能力所影响。能力与分数量尺特性1.对受试者的能力估计不会受到题目特性所影响。2.根据IRT模式与概似函数估计受试者最有可能的程度值,有比较强的数学理论基础。3.可以直接参照题目的特性来解释分数,也可发展出一套参照标准(常模参照或标准参照)来解释分数。4.用某些IRT模式可算出等距量尺。1.对受试者的能力估计会受到题目特性所影响。2.根据各题目的配分直接加总所得的分数,间接推测出受试者的程度值,较缺乏数学理论基础。3.通常需要额外发展出一套参照标准(常模参照或标准参照),才能解释测验分数的意义。4.当

8、群体的分数完全符合常态分布时,才能转换出等距量尺。测量精准度(信度)测量精确度的评估是以题目为单位来计算再加总起来,因此受试者的测量精确度(讯息量)是随着受试者的能力以及所接受的题目特性而有所不同。测量精确

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。