变量统计描述分析

变量统计描述分析

ID:41866922

大小:1017.01 KB

页数:43页

时间:2019-09-03

变量统计描述分析_第1页
变量统计描述分析_第2页
变量统计描述分析_第3页
变量统计描述分析_第4页
变量统计描述分析_第5页
资源描述:

《变量统计描述分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章单变量统计描述分析第一节、统计表与统计图第二节、集中趋势测量法第三节、离散趋势测量法第四节、偏态及峰度第一节统计表与统计图什么是分布?用统计表和统计图来表示分布。P21变量取值要注意的问题:1、取值要穷尽。2、取值要互斥。P22什么是变量?变量就是随时可以变化的量;变量意味着可以取不同的值。变量对应的是常量;具体到调查中,可以把变量理解为问卷中的一道题目所获得的数据,如果是常量的话,我们有没有必要去调查呢?统计表 (频数分布表、百分比分布表)制作统计表的要求?1、要有表号、表头、标识行、主体行、表尾2、表的两端不封口3、简单明了,中间不画线4、百分比分布表要

2、有样本总数一般用得比较多的是百分比分布表,因为百分比分布表可以还原成频数分布表P25统计表 (频数分布表、百分比分布表)怎么样制作统计表?定类变量定序变量定距变量P24-29统计图怎么样制作统计图?用EXCEL定类变量:饼图(圆瓣图),条形图定序变量:条形图定距变量:直方图、折线图P30-33分布图的分析对一个分布图,我们应该关注哪些呢?峰点对称性:是否是正态分布U形曲线和J形曲线P37-39第二节集中趋势测量法集中趋势一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的变量用不同的集中趋势测度值低层次数据的集中趋势测度值适

3、用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定集中趋势测量法一般情况下:定类变量:众数Mo定序变量:中位值Md定距变量:平均值众数众数(概念要点)集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类变量,也可用于定序变量和定距变量众数(计算方法)P40众数(众数的不唯一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242中位值中位值(概念要点)集中趋势的测度值之一

4、排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于定序变量,也可用定距变量,但不能用于定类变量中位值(位置的确定)未分组数据:组距分组数据:21+=N中位值位置2N=中位值位置中位值的计算公式(计算公式)未分组数据的计算公式分组数据的计算公式P44均值均值(概念要点)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于定距变量,不能用于定类变量和定序变量均值(计算公式)设一组数据为:X1,X2,…,XN简单均值的计算公式为设分组后的数据为:X1,X2,…,XK(组中值)相应的频数为:n1,n2,…,ni分组均

5、值的计算公式为åå===++++++=KiiKiiiNNNnnXnnnnXnXnXX11212211LL&均值(数学性质)1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小众数、中位数和均值的比较变量类型与集中趋势测度值表变量类型和所适用的集中趋势测度值变量类型定类变量定序变量定距变量适用的测度值※众数※中位数※均值—众数众数——中位数分布的形状与 众数、中位数和均值的关系对称分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值高层次变量可以用低层次变量的测量方法但统计分析中,更多的是用均值。对于偏态的分布,应使用中位值作为集中趋势

6、。只有单峰和基本对称的图形,用均值作为集中趋势才是合理的。P47第三节离散趋势测量法离散趋势数据分布的另一个重要特征离散趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值离散趋势测量法一般情况下:1.定类变量:异众比率2.定序变量:四分位差3.定距变量:方差及标准差(重点是未分组数据的求法)异众比率异众比率1.离散程度的测度值之一2.非众数组的频数占总频数的比率3.计算公式为P494.用于衡量众数的代表性四分位差四分位差四分位差1.上四分位数与下四

7、分位数之差Q=Q75–Q252.离散程度的测度值之一3.反映了中间50%数据的离散程度4.不受极端值的影响5.用于衡量中位数的代表性四分位值:排序后处于25%和75%位置上的值Q25Q50Q7525%25%25%25%方差和标准差方差和标准差(概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差.总体方差和标准差(计算公式)组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式åå==-=KiiKiiinnXX

8、1122)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。