基于经典测量理论和项目反应理论的等值与连接(二)

基于经典测量理论和项目反应理论的等值与连接(二)

ID:33650480

大小:521.50 KB

页数:18页

时间:2019-02-28

基于经典测量理论和项目反应理论的等值与连接(二)_第1页
基于经典测量理论和项目反应理论的等值与连接(二)_第2页
基于经典测量理论和项目反应理论的等值与连接(二)_第3页
基于经典测量理论和项目反应理论的等值与连接(二)_第4页
基于经典测量理论和项目反应理论的等值与连接(二)_第5页
资源描述:

《基于经典测量理论和项目反应理论的等值与连接(二)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、导言笔者连续写作了三篇论文探讨测验等值和连接的概念、程序、应用以及存在的问题等,本文是这一系列论文的第二篇。本系列论文取材于《一名业界人士对等值和连接的介绍———经典测量理论和项目反应理论入门》(APractitioner'sIntroductiontoEquatingwithPrimersonClassicalTestTheoryandItemResponseTheory,Ryan&Brockmann,2009)。第一篇文章(编者注:此文已发表于《考试研究》2011年第1期)探讨了效度的核心问题,以及在命制试题和组卷过程中构

2、建等值测试版本的重要意义。同时,该文还介绍了等值和连接的主要概念和基本术语,并概述了经典测量理论(CTT)和项目反应理论(IRT)。本文将重点介绍连接和等值的取样及等值设计,并探讨建立题库步骤和基于CTT的等值程序。第三篇将介绍基于IRT的等值技术程序,同时讨论一些普遍的等值问题。本系列论文是面向开发、维护和改进教育测量项目的教育工作者而作的,其目标读者群包括教育测量的用户、从业者以及负责教育测量项目的政策制定者。当然,对于其他想对连接与等值作一些基础的了解,从而进行更深入的技术学习的人来说,这些论文也是非常实用的基础知识。笔

3、者强烈建议读者参阅第一篇文章,其中阐述了这系列文章的背景及思路。一、等值设计:基本概念和术语要运用等值程序对学生的测试成绩进行等值,首先应采用特定的方法采集学生的测试成绩。实施连接和等值运算所使用的成绩数据是依据既定的准则采集的,这个准则即称为数据采集设计或者等值设计。选择使用哪些成绩数据必须具有很强的目的性,并要非常慎重。此外,数据采集必须符合一定的要求并在技术上可行。本文着重讨论下列等值设计及相关主题:l随机组群(等值组群)设计(RandomGroups(EquivalentGroups)Design);l单组设计(Sin

4、gleGroupDesign);l平衡单组设计(SingleGroupDesignwithCounterbalancing);l锚题测试设计(AnchorTestDesign);l创建题库(ItemBankDevelopment);l矩阵型取样测试(MatrixSamplingofItems)。1.随机组群(等值组群)设计(RandomGroups(EquivalentGroups)Design)等值组群设计,也叫随机组群设计,其建立在随机取样的原理上。如果在测试人群中能获得两个足够大的随机样本,那么就可以说这两个样本在学生成

5、就上是“等值”的。也正如《教育测量》(第四版)所述的“达到了同一人群中两个随机样本所能达到的等值”(Brennan,2006)。在此种设计中,两个随机取样的小组使用了不同试卷。使用试卷A和试卷B的小组称为随机等值组。这种设计的取样可以采用分层按比例随机取样法(astratifiedproportionalrandomsampling),使用的分层变量和学生的相关特征相匹配。相对于简单随机取样法(simplerandomsampling)而言,这种设计的取样方法更具有可比性(等值性)。随机组群设计通常采用螺旋测试(spirale

6、dtest)以获得随机取样等值组。在图1所示的例子中,试卷A和试卷B是以这样的顺序打包的:A/B/A/B……,指示考官按照试卷A和试卷B交替发放给学生。这种随机发放试卷的方式在每个班级建立了两个随机取样组。如果采用的是多套试卷,那么打包顺序不一定都是以试卷A开头。试卷叠放顺序的数量与试卷的数量相等,包裹(packet)1以试卷A开头,包裹2以试卷B开头,以此类推。随机发放试卷的方式在每个班级建立了多个随机取样组。在网络机考(thecomputer-basedonlinetest)管理中,使用经过仔细测试的随机数字生成算法(ra

7、ndomnumbergeneratingalgorithm)来随机发放试卷是非常重要的。图1等值组群(随机组群)设计随机组群设计的优点之一是其对单个考生的影响相对较小,并不要求每个考生都做试卷A和试卷B,因此避免了像其他设计那样有时会受顺序问题的影响。顺序影响指的是学生因做试卷的顺序不同而表现出成绩差异,即如果学生需要做两份试卷,做完了第一套试卷可能会影响做第二套试卷的表现。如果“随机”是通过在班级和学校里螺旋发放所有试卷的方式实现,那么这种设计就存在一个缺点。在这种情况下,所有试卷中的全部题目在同一环境中都曝光了,因此,整套

8、题目和试卷的泄密风险升高。这种设计的另一个潜在缺点是需要获得相对较大的样本以显示试卷A和试卷B的题目是稳定可靠的。在某些情况下,对大样本的要求可能使这种设计变得困难或者不可行。这种数据采集设计支持线性等值、等百分位等值以及多种不同的IRT等值法(将在后面介绍)。2.单组设计(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。