多面rasch模型分析软件facets在英语测试中的应用

多面rasch模型分析软件facets在英语测试中的应用

ID:5317766

大小:330.23 KB

页数:10页

时间:2017-12-08

多面rasch模型分析软件facets在英语测试中的应用_第1页
多面rasch模型分析软件facets在英语测试中的应用_第2页
多面rasch模型分析软件facets在英语测试中的应用_第3页
多面rasch模型分析软件facets在英语测试中的应用_第4页
多面rasch模型分析软件facets在英语测试中的应用_第5页
资源描述:

《多面rasch模型分析软件facets在英语测试中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、《中国英语教育》2009年第2期,总第24期EnglishEducationinChinaNumber2,2009多面Rasch模型分析软件Facets在英语测试中的应用石志亮1,韩宝成2(1.中原工学院外语系,郑州450007,河南;2.北京外国语大学中国外语教育研究中心,北京100089)提要:本文阐释了多面Rasch模型的原理,并就其分析软件Facets在国内外英语测试中的研究现状做了评述;然后,通过实例重点讲述了如何运用Facets软件进行实验设计、编写分析语句、运行程序,以及如何从考生面、评分者面

2、、评分标准面等对产生的图表进行解读。关键词:多面Rasch模型;Facets;英语测试;应用中图分类号:H319文献标识码:A1.多面Rasch模型的原理Rasch模型由丹麦数学家GeorgRasch于1960年提出,它是项目反应理论(itemresponsetheory,IRT)中最重要的模型。Rasch模型根据被试回答问题的情况,通过对题目特征函数的运算,来推测被试的能力。Rasch模型超越了以往任何理论,它深入测验的微观领域,将被试特质水平与被试在项目上的行为关联起来并且将其参数化、模型化,是通过统计

3、调整控制误差的最好方法;它把项目难度参数与能力参数定义在同一个量表上,在此模型分析中考生能力与试题参数完全独立;它可以在无样本的情况下对考生的真分数或能力水平进行估计(Bachman,1999)。另外,通过Rasch模型测得的被试能力水平,可以精确估计其测量误差。自Rasch模型建立以来,许多学者试图将模型改进和推广以适应不同的情形。主要工作之一就是为模型添加参数(如,难度、区分度和猜测系数等),使模型与数据更加吻合,其中最为突出的是由芝加哥大学学者JohnMichaelLinacre于1989年提出的多面

4、Rasch模式(many-facetRaschmodel)。Rasch模型是双面(被试能力和试题难度)模型,也是单参数模型,对于项目只考虑难度这一个参数(difficultyindex);若对这一模型进一步拓展,又考虑到区分度参数(discriminativepowderindex)时,它就是一个双参数(三面)模型;三参数(四面)模型则又把猜测系数(guessingindex)也作为一个因素加以考虑。双参数以上的Rasch模型被称为多面Rasch模型。多面Rasch模型继承了Rasch模型的特点并将此模型扩

5、展到包括更复杂测试条件的研究。多面Rasch模型认为测试结果除受被试能力和试题难度两个面影响外,还受更多个面,如评分员严厉程度等的影响。在测量分析中实际设定的面在数量上没有特殊规定,研究者可以根据实际研究的目的确定面的数量。多面模型主要应用于主观性评价的客观化分析,拓展了IRT理论在测评领域的应用空间。多面Rasch模型目前广泛应用在心理和教育测量领域,计算机自适应测试(CAT)也是仰赖IRT的理论与技术。在英语主观测试中,受评分员效应等因素影响,主观评分往往存在各种不一致性,从而导致主观评分的信度降低。B

6、achman(1999)认为,测试分数要想有效,首先必须是可靠的,即测试信度是效度的基础。多面Rasch模型提供的统计框架可以消除英语主观测试评分中各个方面的因素对于评分结果的影响,从而提高评分结果的信度。因为多面Rasch模型除了考生能力和试题难度两个面以外,还将评分员以及评分量表等因素加入了模型,此外还能利用这一模型进行偏差分析,这样它不仅可以分析考生能力和试题难度不同所导致的差异,而且可以找出由其它因素导致的误差来源,从而为考察评分员的评分信度提供参考(刘建达,2007)。2.多面Rasch模型的研究

7、现状目前国内外有关多面Rasch模型在英语测试中的应用研究起步较晚,有关的论文为数1《中国英语教育》2009年第2期,总第24期EnglishEducationinChinaNumber2,2009不多,相关研究主要集中在以下方面:Weigle,S.C.(1998),Chalhoub-Deville,M.,&Wigglesworth,G.(2005),刘建达(2007),谭智(2008)利用多面Rasch模型从宽严度、内在一致性、光环效应(即倾向于在某些维度上给出相似的分数)以及集中趋势等四个方面对评分员信

8、度进行了研究,并提出可以通过改善评分量表和培训评分员来提高考试的信度。他们还对多面Rasch模型的分析结果进行了比较详尽的解释。WilliamJ.Bonk&GaryJ.Ockey(2003),何莲珍等(2008)运用多面Rasch模型对口语考试的信度进行了研究,并且对由于考官的严厉度、任务难度、评分标准和量表等因素可能产生的测量误差、误差大小及误差来源进行了分析。也有人用多面Rasch模型将影响写作测试信度的不同

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。