资源描述:
《试题反应理论介绍116章余民宁》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、试题反应理论的介绍攸关全国三十万国中生多元入学依据的九十年国民中学学生基本学力测验,除了依照标准化测验的编制程序、施测流程之外,还有在测验分数的计算与解释上,也融入现代测验(IRT)的精神与方法,这些无非是为了能从学生的答题结果以精确地估量学生的能力并能公平地作为升学的分发依据。基本学力测验从各学科领域双向细目表的拟定,试题的设计与取样,到明确的施测程序、指导语、计分方式,乃至于试题事前测试(预试)以及信、效度的建立,完全依照标准化的测验编制程序来进行,以使测验能有最佳的测量效果。加上从题库中抽取试题,组成正式测验进行考试,这种做法的优点是试题的相关讯息(包括难易度、
2、鉴别力、所测量的能力指标…等)都已经事先知道了,因此可以依据每次测验的目标,挑选最佳的试题来进行测验,使测验能发挥最准确的测量效果。有关的现代测验理论与统计方法,大部分的社会人士都不太清楚,我们特别邀请心理计量学博士余民宁教授撰文为大家揭开现代测验(IRT)的神秘面纱。余教授现任政大教育系教授兼任教师研习中心主任,其专长为多变量分析、教育研究法、教育测验与评量、测验编制,近十年来致力推动现代测验(IRT)的观念。藉由余教授一系列文章的介绍,从测验编制、题库建立、能力量尺与分数等化,都有详尽的解说,更能让您掌握测验理论的发展趋势以及明了IRT未来的应用,我们期待本专栏的
3、设计,让大家对现代测验(IRT)有更正确的认识,对基本学力测验赋予更大的信任,更重要的是,企盼您给予我们更多的指教与期勉。试题反应理论的介绍一、测验理论的发展趋势九、测验分数的等化(上)二、基本概念和假设十、测验分数的等化(下)三、试题反应模式及其特性十一、题库的建立四、能力与试题参数的估计十二、计算机化适性测验五、模式与数据间适合度的检定十三、试题偏差的诊断六、能力量尺十四、精熟测验七、讯息函数十五、IRT的其他应用八、测验编制十六、IRT的未来第一章政大教育系教授余民宁着考试制度的创设虽然源自中国,绵延数千年后,世界各国争相采用,以作为建立文官制度的选拔依据但是中
4、国却一直没有针对「考试」这门学问进行比较科学化的量化分析,致使近代的心理计量学(psychometrics)却发展且发扬于外国,西风东渐后,才传入中国。心理计量学是一门研究心理测验(psychologicaltesting)与评断(assessment)的科学(Cohen,Montague,Nathanson,&Swerdlik,1988,P.26),是一门包括量化心理学(quantitativepsychology)、个别差异(individualdifferences)、和心理测验理论(mentaltesttheories)等研究范围的学问。比奈-赛门(Binet
5、-Simon)的智力测验,可说是人类有史以来第一个心理测验,测验理论便是起源于此,并由此继续往前发扬光大,成为心理计量学的主要架构。测验理论(testtheory)(或全称叫「心理测验理论」)是一种解释测验数据间实证关系(empiricalrelationships)的有系统的理论学说,它的发展,迄今已迈入不同的新纪元,测验理论学者通常把它划分成二大学派:一为古典测验理论(classicaltesttheory)——主要是以真实分数模式(truescoremodel)(Gullikson,1987;Lord&Novick,1968)为骨干;另一为当代测验理论(mode
6、rntesttheory)——主要是以试题反应理论(itemresponsetheory)(Hambleton&Swaminathan,1985;Hambleton,Swaminathan,&Rogers,1991;Hulin,Drasgow,&Parsons,1983;Lord,1980)为架构。这两派理论目前并行流通于测验学界,但试题反应理论却有后来居上,逐渐凌驾古典测验理论之上,甚至进而取而代之之势。本文作者拟撰写一系列文章,介绍试题反应理论的主要理论内涵及其应用,在此之前,我们有必要从历史的观点,来回顾与展望测验理论的发展趋势,以明了测验理论发展的来龙去脉,这
7、也正是本文的主要目的。两派测验理论之比较比奈-赛门的第一个心理测验问世后,正是心理计量学诞生之始,后经诸多学者(如:Cronbach,1951;Guilford,1954;Gullikson,1987;Guttman,1944;Lord&Novick,1968;Richardson,1936;Terman,1916;Thurstone,1929;Tucker,1946)的研究与阐述,终于归纳形成古典测验理论等学说。古典测验理论的内涵,主要是以真实分数模式(亦即,观察分数等于真实分数与误差分数之和,数学公式为)为理论架构,依据弱势假设(weakassu