资源描述:
《考试分数等值的新框架》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、考试研究2008年4月第4卷第2期ExaminationsResearch考试分数等值的新框架Apr.2008Vol.4,No.2谢小庆【摘要】对考试分数进行等值处理不仅是保证测验信度和公平性的重要环节,也是建立题库和实现计算机化自适应性考试的核心环节。由美国教育协会(ACE)和全美教育测量学会(NCME)联合组织编写的《教育测量》一书被称为教育测量领域中的“圣经”。在2006年出版的《教育测量》(第四版)中提出了一个关于考试分数等值的新框架。本文介绍了这一新框架,并结合作者多年从事考试分数等值的实践,对等值问题进行了讨论。【关键词】考试测验等值分数连接【中图分类号】G449【文献
2、标示码】A【文章编号】1673-1654(2008)02-0004-14目前,数量繁多的考试被广泛应用于社会各个领域。在主要以标准参照方式进行分数解释的能力水平认证考试和职业资格考试中,分数的可比性是考试质量的重要保证。考试被作为一种尺度来对人的心理特质进行测量,因此,这种尺度应该具有稳定性。不同的考试版本之间应该具有一致性。对于同一个测量对象,不能用这个版本测量得到一个度量,用另一个版本测量却得到相差很大的另一个度量。尽管我们在命题过程中总是尽量保持考试难度的稳定性,但不同试卷之间在难度、信度、分数分布上的差别是很难完全避免的。这种差别不仅会影响到测验的质量,影响到评价标准的客观
3、性,而且会使参加考试时间不同、使用试卷不同的考生受到不公平的作者简介谢小庆,博士,研究员,北京语言大学教育测量研究所所长。北京,100083。4考试分数等值的新框架对待。这样,就需要将具有不同难度、不同分数分布的试卷的分数转换到一个统一的量尺之上,采用统一的量尺对应考者进行测量。这种将一个测验的不同版本的分数统一在一个量表上的过程即等值(equating)。20世纪80年代以来,考试分数等值问题成为国际教育与心理测量学领域的一个重要研究课题。1982年,Holland和Rubin编辑出版了第一本以等值为主题的《测验等值》的论文集。1995年,曾先后担任过全美教育测量学会(Natio
4、nalCouncilonMeasurementinEducation,简称NCME)主席的Kolen和Brennan共同出版了《测验等值:方法和实践》一书,这是第一本关于等值的专著。近年来,每年有大量关于考试分数等值的研究报告发表。这些研究包括不同等值设计之间的比较,不同理论模型之间的比较,不同等值系数估计方法之间的比较,造成等值误差因素的分析,以及关于等值误差的估计方法等等。如何实现测验等值?怎样进行等值设计?怎样进行基于经典测验理论和项目反应理论的等值数据处理?在众多的等值模型中如何进行选择?不同的等值模型适用的条件是什么?这些是当前许多考试机构共同关心的问题。一、考试等值的新
5、框架在教育与心理测量领域和人力资源开发领域《,教育测量》(Educationalmeasurement)是一部重要的参考文献。从1951年以来,已陆续出版了四版。在《教育测量》第四版的封套上写道“:从1951年ACE出版《教育测量》一书以来,它就是这一领域的圣经(Bible)。”这种说法并非没有道理。《教育测量》的四个版本都是教育与心理测量领域中最优秀的专家的合作产物,它的每一章都由对相关问题最具有实力的研究者执笔,并由相关领域中最重要的研究者担任审稿人,基本反映了该领域的最新观点和最新研究成果。《教育测量》的各个版本都是教育测量领域中被引用最多的出版物。与前几版一样,第四版的内容
6、覆盖了效度、信度、量表和常模、等值、公平性、考试技术、考试安全、考试应用等主要问题。第四版的第六章为“连接和等值(linkingandequating)”,该章的作者为PaulWHolland和NeilJDorans。他们提出了一个关于测验等值的新框架。图1是这一新框架的示意图。从5《考试研究》第4卷第2期图1可以看出“,连接(linking)”成为一个更基本的概念。测验之间的连接包括预测(predicting)、量表化(scaling)和等值(equating)三种不同的方式。例如,我们可以根据中国汉语水平考试(HSK)的成绩来预测商业汉语考试(BCT)的成绩,HSK与BCT的连
7、接方式是“预测”而不是“等值”,也不是“量表化”。我们把HSK(基础)、HSK(初中等)和HSK(高等)组成一个包括3级到11级的汉语水平量表,HSK(基础)与HSK(高级)的关系既不是“预测”,也不是“等值”,而是一个量表化的过程。HSK(初中等)考试每年在海内外施测多次,在不同试卷之间建立可比性的过程,即为“等值”。图1测验之间的连接相当长的时间中,教育测量学家将等值分为横向等值(horizontalequating)和纵向等值(verticalequating)