欢迎来到天天文库
浏览记录
ID:46511096
大小:3.14 MB
页数:43页
时间:2019-11-24
《统计资料的整理和程序》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章教育统计资料的整理第一节数据的概念与种类第二节统计资料整理的意义与程序第三节统计表第四节统计图本章主要内容第一节数据的概念与种类一、数据的概念与特点(一)数据的概念数据即带有单位的数,它是通过对具体事物进行计数或者测量所得到描述事物特征的数量依据。换句话说,数据是从数量关系的角度反映事物的存在状态。(二)数据的特点变异性数据的变异性是指对客观事物观察或测量得到的一组数据,其数值大小总是在一定范围内不断变化,表示出不同程度上的差异。规律性数据的规律性是指在一定范围内,其数值呈现出差异的同时又存在着一定的规律性,即数据的分布具有规律性。二、数据的种类(一)按变量
2、的测量水平分,可分为:称名变量、等级变量和比率变量1.称名变量:是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。例如:用“1”表示男性,用“0”表示女性。2.等级变量:又称顺序变量,是指在对事物的分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。3.等距变量:是指在观测标识事物某一特定属性时,具有相对参照点、相等单位的变量。4.比率变量:是指既有绝对参照点,又有相同单位的变量。如物体的长度、重量、体积等。(二)按数据的获得方式分,可分成计数数据和测量数据1.计数数据:是以计算个数的方式得到的数据。如:学校数、教师数、学生数等。2.测量数据
3、:需要借助一定的测量工具来获得。如:身高、体重、考试分数等。(三)按数据分布的形式分,可分为离散变量和连续变量1.离散变量:是指在量尺上其取值有限且彼此不连续的数据。特点:代数轴上可能取到的有限个点值;以整数的形式出现,小数或分数没有实际含义。2.连续变量:是指在一定范围内连续变化、取值无限多的变量。特点:代表数轴上的一段距离;具有实数的稠密性。确定实限的方法:连续变量取值的表述形式加上它最末一个数位的半个单位值,为实上限;减去它最末一个数位的半个单位值,为实下限。例:确定连续变量取值19的实限。解:19的最末一个数位的单位值是1,一半是0.5,所以19的上限是1
4、9+0.5=19.5,下限为19-0.5=18.5。即19的实际代表范围是[18.5,19.5)这一左闭右开区间。练习:1.确定连续变量取值15.6的实限2.确定连续变量取值10.00的实限第二节统计资料整理的意义与程序一、统计资料整理的意义首先,统计资料的整理是对统计调查的进一步深化。其次,统计资料的整理是统计分析的前提。二、统计资料整理的程序(一)分组分组:即根据研究的任务及统计事项内在的特征,按一定的标志把数据资料进行归类,将性质相同的数据归为一组。有简单分组和复合分组。标志:指统计总体内各单位所具有的区别于其他单位的属性或特征。分为:品质标志和数量标志。(
5、二)汇总(三)列统计表统计表:就是把统计指标和被说明的统计事项用表格的形式表示出来,使人一目了然。如:学历研究生本科专科高中初中合计人数259836125176表1某中学教职工学历情况统计第三节统计表一、统计表的作用与种类(一)统计表的作用统计表作为统计资料的最主要的表现形式之一,是自下而上定期地向上级行政部门传送统计资料的重要载体。(二)统计表的种类1.简单表:又称单项表,只按一个标志简单列出调查单位(名称、地点)、时序(年、月)或统计指标名称的统计表。如:表2某中学教师2002——2005年度公开发表论文统计表年份篇数200220032004200524364
6、572表3某学校男女学生人数统计表2.分组表:将统计资料按某个标志(品质或数量)进行分组列成的统计表例如:初中一年级初中二年级初中三年级合计男生125136118379女生148127134409合计2732632527883.复合表:按两个或两个以上标志分组列成的例如:表4客户产品销售情况统计表二、次数分布表表现总体单位在各组的次数分配情况的统计表,叫做次数分布表。(一)简单次数分布表编制简单次数分布表的一般步骤如下:1.求全距:全距(range)是指所有数据中最大值与最小值之间的差距。用符号R表示,全距的计算公式是:2.定组数定组数就是将全距分为若干组。用符号
7、k表示。组数多少没有严格规定,视资料的性质和数据多少而定。组数不宜太多,太多不但计算麻烦,而且范围太小,不能明显表示出分布的主要趋势。但也不宜太少,太少则可能把很多不同事实归于一类,其分布的主要特征被掩盖。一般分组以10——20组以下为宜。3.求组距组距就是每组的间隔,常以i表示,组距一般是相等的,组距的大小是由全距的长短以及组数的多少决定的。组距(i)=全距(R)/组数(k)一般是取5的倍数,如5,10,……4.定组限组限是每个组的起始点界限。起点值称组下限,终点值称组上限。次数分布表中最高组的上限应为全部观测值中的最大值,而最低组的下限应为最小值。但是有时为了
8、方便计算,
此文档下载收益归作者所有