欢迎来到天天文库
浏览记录
ID:1202987
大小:179.50 KB
页数:40页
时间:2017-11-08
《外语教学与研究统计方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、外语教学与研究统计方法为什么要学习统计方法?1.统计方法给我们一种看问题的视角、分析问题的手段,使我们可以从数量的角度,分析和认识现象的特点、规律、模式、趋势或关系。2.统计方法给我们一种精确测量的手段。例如对于“水平高”的概念,我们可以用数学计量的手段给予更精确的描述。3.可以使我们对现象的数量表现,做出更科学的判断。4.增强研究的自主性。数据收集的过程是自主的,对数据的处理和分析是原创的,得出的结论大大避免了抄袭的危险。第一讲基本概念1.数据类型:定类数据与定距数据2.总体与样本3.误差:抽样误差与非抽样误差4.显著性与显著水平1
2、.不同的数据需要采用不同的统计方法;2.人们一般研究的都是样本;3.统计中误差无所不在;4.显著性反映的是研究结论的确定性。数据类型之:定类数据定类数据是一种分类数据。它是对观测对象按不同特性分类,并统计各类出现的次数(频数)后得到的结果。例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分,只有频数高低。不能在类之间进行数学运算。性别(n=50)课程(n=50)男(1)女(2)精读写作口语翻译203045402048数据类型之:定距数据定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位,单位之间
3、的距离是相等的。例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算,比较不同数值之间的大小。A班学生的期末考试成绩(n=25)66686956777457727464805868518272756384786771767566总体总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体,某校一年级新生则是小总体。样本样本指从总体中选取的一部分个体。由于常常不能直接研究总体,所以人们常常通过样本来推断总体。样本有随机样本和非随机样本之分。抽样误差抽样误差是客观存在。只要从总体中抽取样本,
4、就会存在抽样误差。从一个总体中抽取的样本均值与总体均值之间多数存在差异。从一个总体中抽取的不同样本均值之间也多数存在差异。为了减少抽样误差,最好用随机抽取的大样本。Mean=28Mean1=25Mean2=30非抽样误差非抽样误差是由于技术上原因,如测量工具不准,或是人为操作造成的误差。比较典型的非抽样误差是考试分数合计错误,或者是数据录入失误。避免非抽样误差的方法是仔细测量和认真录入与核对。显著性显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。显著性水平显著性水平是衡量显著性
5、的标准。在社会科学和应用语言学研究中,通常设定的显著水平为p=0.05。大于0.05的统计结果,通常说无显著差异,或无显著相关。等于/小于0.05的统计结果,通常说有显著差异,或显著相关。描述统计平均值、标准差、交互表、频数表平均值:所有个值之和除以个值的数目。总体均值用μ表示,样本均值用表示。70个学生的四级平均成绩标准差:是数据内部差异的一种量度。标准差越大,内部差异也越大。例:两个班期末考试平均分相等,甲班的标准差为5分,乙班的标准差为10分,说明乙班的内部差异大于甲班。70个学生四级成绩的标准差EmpiricalRule
6、1经验法则1正态分布的数据-1σμ+1σ大约68%的数值在均值的一个标准差范围内EmpiricalRule2正态分布的数据-2σμ+2σ大约95%的数值在均值的2个标准差范围内。EmpiricalRule3正态分布的数据-3σμ+3σ几乎全部(99.7%)数值在3个标准差范围内。大学英语四级考试成绩分布均值:500标准差:70430500570大约68%的四级考试分数在430到570之间。大学英语四级考试成绩分布2360500640大约95%的考试分数在360到640之间。英语四级考试成绩分布290500710几乎全部(99.7%)数
7、值在290到710之间。交互表交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数,分别有2x2表,2x3表,或者jxk表。焦虑成绩正常不正常及格607不及格430频数表一种频数表是简单罗列数据中每个数值出现的次数;另一种频数表是按一定的区间,分组统计和罗列数值出现的次数。数值频数数值频数555658596062652345108970758186899091131075321数值区间频数55-5960-6970-7980-8990-99142723153推断统计推断统计主要根据概率理论,利用各种分布模型,进行组之间、变量之间
8、的差异或相关的显著性检验。推断统计主要回答的问题是:1)不同组或不同变量的均值之间存在的差异是否显著?2)两个变量之间的相关关系是否显著?常用的差异检验方法1)独立样本的t检验2)成对样本的t检验3)一元方差分析4)卡方
此文档下载收益归作者所有