欢迎来到天天文库
浏览记录
ID:52101387
大小:590.00 KB
页数:26页
时间:2020-03-31
《《统计资料的整理》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、为什么进行统计资料的整理?分类表中序列表与频数估计表各适合于何种情况?双变量二元分布表中数据的含义如何?统计资料整理的目的调查收集到的原始统计资料常常是大量的。它必须经过加工整理,如分类归并汇总,按时间前后或按数值大小重新排列等,才容易发现数据的规律性,并便于做进一步的统计分析。加工整理,归并汇总,重新排列调查得到的原始统计资料发现数据的规律性,作进一步的统计分析统计表类型将变量所取值按时间顺序排列序列表分类表按数值分类定性分布频数分布时间序列表地域序列将变量所取值按地域排列按性质分类2.1统计表时间序列表的例子:2.1统计表定性分布:首先建立一个元素的类别系统,使得各类互相排斥
2、,而且是完备的,使被观测的各元素能既不重复又无遗漏地分到各类中去。然后记录分到同类中的元素个数,或将同类中各元素的观测值加以归并,这样得到定性分布。元素分类观测值记录与归并定性分布2.1统计表定性分布的例子:2.1统计表频数分布:按变量所取的值进行分类,于是资料中每个观测值都分到相应类中去。记录各类中观测值出现的次数,制成频数分布表。确定组数k找出xmin与xmax计算组距h确定每组上下限将相应数据归并到各组Xmin最小值,xmax最大值2.1统计表分数计数人数(f)40—49150—59正正1460—69正正正正正正正正正正正5570—79正正正正正正正正正正正5880—89正
3、正正正正正正正正正5290—99正正正17100—1093总数200在所属组的记录栏做一记号,按照我国习惯,用写“正”字方法,英文书使用“#”符号表2-4某校200个学生高等数学考试成绩2.1统计表表2-5某校200个学生高等数学考试成绩的频数分布表分数人数(f)分数人数(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539总数2002.1统计表2.1统计表表2-5与表2-6的对比表2-5中组距等于6,频数分布的规则性,仍然可以维持,同时细节的损失也可减轻表2-6中的组距等于2
4、,各组频数分布就变得很不规则了。由此可见,组数的确定应适当,亦不宜太多2.1统计表累积频数(CumulativeFrequency):由第一组起至第i组止各频数之和称为第i组的累积频数,记为Fi,即:频率(PercentFrequency):就是频数除以总数n:fi/n,经常以百分数表示。累计频数与频率2.1统计表频数表的例子2.1统计表统计图:统计资料整理成统计表后,可以比较清晰地展示变量的变化规律。为了使这种规律更有直观性,常采用统计图表示。包括:线图、条形图、圆饼图等2.2统计图2.2统计图线图(Linegraph)2.2统计图(亿元)条形图(Barchart)2.2统计图
5、(亿元)圆饼图(Piechart)2.2统计图散点图(ScatterDiagram)2.2统计图双变量的统计资料:对每一元素观测两个特征,记录观测结果,就是双变量的统计资料双变量常用(X,Y)形式表示,以区别两个单变量X和Y2.3双变量的二元分布错误发生时的飞行状态,分起飞(T),巡航(C)和着陆(L)三种。错误发生的原因,分规范理解错误(R),仪表读数错误(M)和其它原因(O)三种。[例2.1]在飞行模拟训练时,用计算机测定并打印出飞行动作的错误,从两方面进行测定:2.3双变量的二元分布测定45次的打印记录如下:2.3双变量的二元分布根据该记录整理的二元分布表如下:从表中看出,
6、在起飞(T)时容易发生规范理解错误(R)和仪表读数错误(M),而着陆(L)时不太容易发生规范理解错误。2.3双变量的二元分布边际分布:在二元分布表最下行(合计行)和最右列(合计列)分别是X和Y的单变量分布,称为边际分布。二元分布表最下行二元分布表最右行X的单变量分布Y的单变量分布边际分布统称2.3双变量的二元分布一个双变量的二元分布绝不同于两个单变量的一元分布,它不仅说明两变量各自的分布情况,而且说明两变量之间(飞行状态与错误原因之间)的相互关联情况。而这种关联情况(即是否存在关联以及关联的性态和程度等)正是研究双变量的二元分布的主要任务。双变量二元分布两变量各自的分布情况变量之
7、间相互关联情况研究二元分布的主要任务说明2.3双变量的二元分布对于三变量(X,Y,Z)的统计资料,整理成分布表的形式是困难的,常用的方法是对于X的每一特定值xi,研究(Y,Z)的二元分布。更多变量的情形也类似。2.3双变量的二元分布
此文档下载收益归作者所有