试论语言测试中的信度和效度

试论语言测试中的信度和效度

ID:5278656

大小:231.03 KB

页数:4页

时间:2017-12-07

试论语言测试中的信度和效度_第1页
试论语言测试中的信度和效度_第2页
试论语言测试中的信度和效度_第3页
试论语言测试中的信度和效度_第4页
资源描述:

《试论语言测试中的信度和效度》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、http://www.paper.edu.cn试论语言测试中的信度和效度11范金平,邹晓玲1重庆大学外国语学院,重庆(400044)摘要:语言测试是语言教学的重要环节,本文就语言测试的两个重要标准信度和效度进行了较详尽的阐述,以期对语言教师的命题及评价测试更具有科学性有所裨益。关键字:语言测试;标准;信度;效度中图分类号:H0-01.引言语言测试在教学中的主要目的是对学生所掌握的知识和所具有的能力进行评价。然而,测试能否是客观的、公正的、甚至是权威的评估,却取决于测试的质量。谈到测试的质量,必然涉及到测试的标准。那么,测试的标准是什么呢?国内外有许多语言学家都作过论述。他们认为,评估语言测试的

2、主要标准有:信度、效度、区分度和可行性,其中信度和效度是测试最重要、最基本的要求。换言之,一个测试如果失去了信度与效度,其它标准便无从谈起。本文拟就信度与效度作一阐述,以便对语言测试有较深入的了解。2.信度(Reliability)2.1信度的概念[6]信度也称可靠性,即当被测试对象本身发生变化,用同样的“尺子”去重复测试时,总是获得类似的结果。因此,信度也被称为一致性(consistency)。如果说一个测试的信度高,便是指一个考生的成绩序列经反复测试都大致相同。如果说某次测试完全可靠,那便是指这次测试排除了一切误差、绝对的准确。即一个考生的成绩经反复测试后完全保持一致,一组考生经反复测试后

3、,其成绩序列完全相同。其实,绝对的准确是不可能的,因为人的因素是不稳定的。2.2信度的评估[1]信度的评估一般用考试结果的相关系数来表示。相关系数等于1表示该卷完全可靠,相关系数等于0则说明该试卷完全不可靠。在实践中,人们往往根据具体情况对试卷的信度提出不同的要求。通常是客观题的信度高于主观题。客观题的信度系数一般定在0.99以上。如果一份试卷既有客观题又有主观题,信度系数最好不低于0.80。在英语测试中,一份好的试卷,其词汇、结构和阅读部分的信度系数一般应在0.80-0.89之间,口试的信度系数一般在0.70-0.79之间。[7]对信度系数的评估方法主要有三种:再测信度、平行试卷信度和内部一

4、致信度。(1)再测信度(Test-Retest)。这种方法是指用同一份试卷在相同的条件下对同一批考生在不同的时间内进行两次测试。两次考试的相关系数则是再测信度。[5](2)平行试卷信度(ParallelForms)。平行试卷信度(也可译为复本信度)是对再测信度的改进,它是指用两份或几份在格式、内容、难度和题目数量等方面都平行、一致或等值的试卷,在不同的时间内对同一批考生进行测试。两次测试结果的相关系数便是平行试卷信度。这种计算信度的方法与计算再测信度的公式相同。这种方法虽然不是前一次测试的重复,其测试的内容不同,并且两次测试的时间间隔可以很短(一般在两周内),但在命题时要使两套试卷完全等值是非

5、常困难的。(3)内部一致信度(InternalConsistencyReliability)。这种方法使用的最广泛。它是指应-1-http://www.paper.edu.cn用每个题目的方差来评估整份试卷的信度。2.3影响信度的因素[10]影响信度的主要因素有:(1)考生水平的差异。考生水平越接近,试卷信度越低;考生水平差异越大(标准差也往往很大),信度越高。(2)题目数量。试题数量越少,信度越低;数量越多,信度越高。(3)题目的区分度。区分能力强的题目越多,信度越高,反之亦然。通常,命题人员用提高试题题目的区分度和增加试题题目的数量提高信度。当然,试题题目数量也不能无限的增加,因考试时间是

6、有限的。所以,为了提高试卷的信度,还必须考虑测试质量的另一个及其重要的标准—效度。3.效度(Validity)3.1效度的概念[2]考试的效度(有效性)指考试是否测量了它所要测量的东西,是否达到了它所预定的目的。效度是一个相对的概念。换言之,一个考试的效度可有高低之分,但不能简单地说全部有效或全部无效。除非给有效与无效规定效度系数的界限。这主要是因为个人或群体的语言能力特征,只能通过其行为样本间接推测,而不是绝对有效。从这个意义上讲,效度也可以说是一个程度上的概念,它反映根据考试分数作出推论或预测的准确程度。3.2效度的评估一般地说,效度可以从以下几个方面评估。[12](1)内容效度(Cont

7、entValidity)。内容效度是指考试的内容是否具有代表性和综合性,或者说是否考了应考的内容。一份试卷不可能包括所有要考的内容,所以,选择内容的方法非常关键。例如:有30个题目是考英语语法的,而有20个题目是考主谓一致性方面的,这就很难完全反映出考生的语法能力。因为英语语法覆盖面很广,还包括动词时态、动词短语、介词短语、不定式短语、分词短语,等等。所以这样的考试,其内容效度必然很低。(2)效标

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。