欢迎来到天天文库
浏览记录
ID:9910327
大小:26.00 KB
页数:8页
时间:2018-05-15
《应用于考试中的irt 参数估计简化程序设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、应用于考试中的IRT参数估计简化程序设计朱宁宁 目前,越来越多的考试都应用项目反应理论ItemResponseTheory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。 但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等Embretson&Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要是供研究者使用
2、的,并不容易为一般应用者所掌握。这些问题的存在,导致了我国考试界对IRT技术了解不深和应用不广。 实际上,对于计划要在考试中使用IRT技术的广大考试管理者和实施者而言,他们更希望有一个易于使用,并能满足一般数据处理要求的IRT参数估计程序,以便能将现在的考试系统提升到一个新的更有效的水平上,并能适应现代计算机技术不断进步的要求。 本研究使用边缘极大似然估计MMLE)的方法进行项目参数的估计,并用贝叶斯法Bayes)期望后验估计EAP)的方法进行结果分数参数估计Baker,1992),设计出一个功能简化的
3、用于二级计分的2PL模型的参数估计程序,简称MyPro。这一程序的特点是:使用简便,嵌入性较强。 1模型简介 二级计分的2PL模型项目特征曲线可表示为: Pi(1/2) 其中,Zij=j-i为题目区分读,λi为题目的难度。 2.MyPro与Bilog在估计结果上的对比 BILOG(Mislevy&Bock,1990)是用于二级计分的项目反应理论模型参数估计的流行工具,这个程序已经有适用于Windows平台的版本,可完全通过菜单设置参数,来完成1PL、2PL和3PL的IRT模型的参数估计。在本研究中,使
4、用的对比程序就是BILOG(3.11版)。BILOG-3程序使用流行的(MMLE)方法来进行项目参数的估计,默认用(EAP)方法进行特质参数的估计。 下面,用蒙特卡洛(MonteCarlo)模拟方法,将MyPro与Bilog-3加以对比,以观察其可用性。首先模拟10次考试数据:每次考试有3000个考生参加,试卷的题量为50题。其中,题目鉴别度A采用Log正态分布加以模拟,题目难度B采用正态分布模拟。能力值Theta也使用正态分布模拟。受测者的应答情况采用2PL模型加以模拟(由于模型本身即要求数据的一维性,因此模拟
5、的数据已经符合模型的要求,不必再进行模型符合性的相关检验)。 得到10组受测者应答矩阵以后,分别使用MyPro和Bilog-3进行参数的估计。MyPro和Bilog-3方法得到A值、B值和THETA值的各10组数据,将这些数据分别和初始模拟的A值、B值和THETA值进行比较,分别计算出每一组的误差的标准差的平均值,以之作为估计误差。结果如表1所示: 从表1中可以发现: (1)将MyPro和Bilog-3的估计结果与模拟的初值进行误差分析,发现两个程序的估计的准确性水平较为一致。可认为这两种程序的估计具有同样的
6、准确性。 (2)通过对比MyPro和Bilog-3两种程序的估计结果,发现两个程序的估计结果的差异较小。可认为两种程序的估计结果之间具有一致性。 从模拟研究结果观察,MyPro这个参数估计程序,虽然距离Bilog的复杂性还有很大的差距,但是已经达到了可用的标准。 需要使用者注意的是:和Bilog等程序一样,MyPro简化程序没有包含IRT模型假设检验过程,因此需要用户预先保证输入MyPro的数据是符合IRT的模型假设的(可通过DIMTEST或DETECT等程序考察数据的特征)。 3MyPro的用法介绍
7、MyPro这个程序包含两个功能:MyPro.MMLE和MyPro.EAP,分别用于估计项目参数估计和能力参数。用户可选择需要的功能,分别进行调用。 MyPro.MMLE包含三个参数:vData,1MNC和dJD。最简单的情况下,用户只需要输入vData这个参数,这是考生在每个题目上的得分数据,按照以下形式排列(n名考生,m个题目): 其中,1MNC用于设定最大的迭代次数(默认为100),dJD用于估计精度(默认为0.001),这两个参数都是可选的。估计结束以后,会生成一个结果文件:EM.LOG。包含A与B参数的
8、估计值,及其卡方检验结果。使用者可直接调用项目参数估计的这些结果。下面举例说明如何用一个Windows的脚本运行这一程序:setMyPro=Server.CreateObject("IRT.MyPro")MyPro.MMLEvData MyPro.EAP也包含三个参数:vData,vA和vB。这三个参数都是必需的,vData参数包含某个考生在每个题目上的得
此文档下载收益归作者所有