资源描述:
《附录:单元教学计划》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、几种常见等值方法的统一处理TreatSomeCommonEquatingMethodsinaUnifiedForm丁树良*熊建华***江西师范大学计算机学院E-mail:slding@public.nc.jx.cnpansy1212@sina.com本文将IRT框架下几种常用的等值方法的目标函数用一个统一形式进行描述,并且用这种统一的形式导出了两种新的等值方法,其中的相对熵等值法与Haebara和Stocking-Lord给出的等值方法计算出的等值系数十分接近。关键词:目标函数统一形式相对熵等值法1引言大型题库是计算机化自适应测
2、验(Computerizedadaptivetest,CAT)的基础。大型题库建设离不开测验等值[1-3,5],对教育的评价也离不开等值。测验等值是指将测量同一心理特质的多个测验形式上的测验分数(或潜特质水平)或项目参数实现单位系统转换,达到相互间对应指标可比的过程[1,2]。本文在项目反应理论(ItemResponseTheory,IRT)框架下讨论等值问题,注意到IRT中二参数Logistic模型(2PLM)是使用Logistic模型等值的最基本模式,我们先讨论2PLM中几种常见的项目参数等值方法的统一处理问题,然后将这种统
3、一的等值方法推广到双参数Samejima等级记分模型。本文的讨论都假定是在满足等值条件之下进行的,且对于项目参数的估计经过了模型资料拟合检验。我们还假定测验经过等值设计,即采用锚测验-非等组设计。2几种常用的等值方法设有Nx和NY个被试分别参加了测验X和Y,X与Y中含有m个锚题(anchoritem)。由IRT知,同一测验项目在两个不同测验中估出的值之间有如下关系:(1)而同一被试在两个不同测验上估出的能力参数有关系式(2)这里A、B称为等值系数。若用表示能力为的被试答对区分度为a,难度为b的项目的概率,则只要,便有恒等式(3)
4、由于,故由(3)有(4)若,即为2PLM,则(4)也可以写成203(5)的形式,而且将(4)改写成(5)的形式往往计算起来更方便。记(6)注意到(5)左右两边,,皆为估计值,故只能近似相等。若用表示,之间的某种意义下的差距,则可以认为,等值是寻找等值常数A,B,使形如下面的一个目标函数F达到最小:目前基于IRT的较流行的等值方法(实际上是按目标函数的形式给予区分的)有均值-均值方法,均值-标准差方法,稳健的迭代加权均值-标准差方法,Haebara的项目特征曲线方法(简记为Hcrit),Stocking-Lord测验特征曲线方法(
5、简记为SLcrit)[5],以及Kim和Cohen的最小-方法[4]。3统一的表示形式以下讨论几种常用等值方法的统一表示形式,即给出目标函数的统一形式。记,,同样定义及,再记(7)这里,d,h,f,g都是映射,它们的具体含义根据上下文进一步说明。(ⅰ)由IRT中等值要求知测验X与Y对称,对m个锚题的难度在两个测验形式中的估计值向量和,其相关系数应该等于1,今在(7)中取,记为,为,,则于是(8)这里表对向量x取转置运算。(8)是均值-标准差方法的目标函数。通过不同的的选取,可导出稳健的均值-标准差方法的目标函数[3,PP207-
6、208]以及稳健的迭代加权均值-标准差方法[3,PP208-209]。(ii)取,,令则得Heabara方法的目标函数如下:(9)相仿,通过对的不同选取,还可以导出SLcrit[5]以及最小-方法等值的目标函数[4]。4统一表达式的应用统一表达式除了可以揭露不同的方法之间的相同之处外,还可以用来推广一些等值方法。例1在等级记分题中,记,为第j个项目的满分值,,,相仿可定义,则由(9)立即可得等级记分题对应的Heabara项目特征曲线法,记为(10)但严格地讲(10)是类目响应函数(categoryresponsefunction
7、)方法,而不是Hcrit203。若以项目为单位进行考察,则有另一个相应于Heabara方法的目标函数。对于Samejima模型,,且,而当时则有(11)这是Hcrit在等级记分模式下的推广。仿上,给出相应的f,g,h,d,也可将SLcrit推广到Samejima等级记分模式,即给出目标函数(12)同样地,我们还可以将最小-方法推广到等级记分模式[5]。例2若在0-1记分模式下,记,同样定义,,则=(13)这是陈希镇2001年5月给出的一个等值目标函数,相仿还可给出另一个目标函数(14)例3在0-1记分模式下,记,,同样定义,再定
8、义(15)其中,j=1,2,…,m事实上,(15)所表示的是与的相对熵(relativeentropy)(16)但(16)中x与y不对称,故可以再定义(17)若考虑等级记分模式,(17)式可以拓广为(18)经实际计算和反复模拟,(18)和(10)、(11)、(1