应用于考试中的irt 参数估计简化程序设计

应用于考试中的irt 参数估计简化程序设计

ID:9910327

大小:26.00 KB

页数:8页

时间:2018-05-15

应用于考试中的irt 参数估计简化程序设计_第1页
应用于考试中的irt 参数估计简化程序设计_第2页
应用于考试中的irt 参数估计简化程序设计_第3页
应用于考试中的irt 参数估计简化程序设计_第4页
应用于考试中的irt 参数估计简化程序设计_第5页
资源描述:

《应用于考试中的irt 参数估计简化程序设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、应用于考试中的IRT参数估计简化程序设计朱宁宁   目前,越来越多的考试都应用项目反应理论ItemResponseTheory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。  但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等Embretson&Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要是供研究者使用

2、的,并不容易为一般应用者所掌握。这些问题的存在,导致了我国考试界对IRT技术了解不深和应用不广。  实际上,对于计划要在考试中使用IRT技术的广大考试管理者和实施者而言,他们更希望有一个易于使用,并能满足一般数据处理要求的IRT参数估计程序,以便能将现在的考试系统提升到一个新的更有效的水平上,并能适应现代计算机技术不断进步的要求。  本研究使用边缘极大似然估计MMLE)的方法进行项目参数的估计,并用贝叶斯法Bayes)期望后验估计EAP)的方法进行结果分数参数估计Baker,1992),设计出一个功能简化的

3、用于二级计分的2PL模型的参数估计程序,简称MyPro。这一程序的特点是:使用简便,嵌入性较强。  1模型简介  二级计分的2PL模型项目特征曲线可表示为:  Pi(1/2)  其中,Zij=j-i为题目区分读,λi为题目的难度。  2.MyPro与Bilog在估计结果上的对比  BILOG(Mislevy&Bock,1990)是用于二级计分的项目反应理论模型参数估计的流行工具,这个程序已经有适用于Windows平台的版本,可完全通过菜单设置参数,来完成1PL、2PL和3PL的IRT模型的参数估计。在本研究中,使

4、用的对比程序就是BILOG(3.11版)。BILOG-3程序使用流行的(MMLE)方法来进行项目参数的估计,默认用(EAP)方法进行特质参数的估计。  下面,用蒙特卡洛(MonteCarlo)模拟方法,将MyPro与Bilog-3加以对比,以观察其可用性。首先模拟10次考试数据:每次考试有3000个考生参加,试卷的题量为50题。其中,题目鉴别度A采用Log正态分布加以模拟,题目难度B采用正态分布模拟。能力值Theta也使用正态分布模拟。受测者的应答情况采用2PL模型加以模拟(由于模型本身即要求数据的一维性,因此模拟

5、的数据已经符合模型的要求,不必再进行模型符合性的相关检验)。  得到10组受测者应答矩阵以后,分别使用MyPro和Bilog-3进行参数的估计。MyPro和Bilog-3方法得到A值、B值和THETA值的各10组数据,将这些数据分别和初始模拟的A值、B值和THETA值进行比较,分别计算出每一组的误差的标准差的平均值,以之作为估计误差。结果如表1所示:  从表1中可以发现:  (1)将MyPro和Bilog-3的估计结果与模拟的初值进行误差分析,发现两个程序的估计的准确性水平较为一致。可认为这两种程序的估计具有同样的

6、准确性。  (2)通过对比MyPro和Bilog-3两种程序的估计结果,发现两个程序的估计结果的差异较小。可认为两种程序的估计结果之间具有一致性。  从模拟研究结果观察,MyPro这个参数估计程序,虽然距离Bilog的复杂性还有很大的差距,但是已经达到了可用的标准。  需要使用者注意的是:和Bilog等程序一样,MyPro简化程序没有包含IRT模型假设检验过程,因此需要用户预先保证输入MyPro的数据是符合IRT的模型假设的(可通过DIMTEST或DETECT等程序考察数据的特征)。  3MyPro的用法介绍  

7、MyPro这个程序包含两个功能:MyPro.MMLE和MyPro.EAP,分别用于估计项目参数估计和能力参数。用户可选择需要的功能,分别进行调用。  MyPro.MMLE包含三个参数:vData,1MNC和dJD。最简单的情况下,用户只需要输入vData这个参数,这是考生在每个题目上的得分数据,按照以下形式排列(n名考生,m个题目):  其中,1MNC用于设定最大的迭代次数(默认为100),dJD用于估计精度(默认为0.001),这两个参数都是可选的。估计结束以后,会生成一个结果文件:EM.LOG。包含A与B参数的

8、估计值,及其卡方检验结果。使用者可直接调用项目参数估计的这些结果。下面举例说明如何用一个Windows的脚本运行这一程序:setMyPro=Server.CreateObject("IRT.MyPro")MyPro.MMLEvData  MyPro.EAP也包含三个参数:vData,vA和vB。这三个参数都是必需的,vData参数包含某个考生在每个题目上的得

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。