欢迎来到天天文库
浏览记录
ID:40229280
大小:276.50 KB
页数:15页
时间:2019-07-27
《实验四 描述性统计分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验四描述性统计分析峰度数据的特征和测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差四分位差异众比率偏态一、集中趋势的测度定类数据:众数定序数据:中位数和分位数定距和定比数据:均值众数、中位数和均值的比较1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定I.众
2、数(Mode)1、集中趋势的测度值之一2、出现次数最多的变量值3、不受极端值的影响4、可能没有众数或有几个众数5、主要用于定类数据,也可用于定序数据和数值型数据II.中位数(Median)6、集中趋势的测度值之一7、排序后处于中间位置上的值Me50%50%1、不受极端值的影响2、主要用于定序数据,也可用数值型数据,但不能用于定类数据3、各变量值与中位数的离差绝对值之和最小,即I.四分位数(Quartiles)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值QLQMQU25%25%25%25%3.不受极端值的影响4.主要用于
3、定序数据,也可用于数值型数据,但不能用于定类数据II.均值(Mean)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据众数、中位数和均值的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值二、离散程度的测度定类数据:异众比率定序数据:四分位差定距和定比数据:方差及标准差I.异众比率1.离散程度的测度值之一2.非众数组的频数占总频数的比率3.仅用于定类数据4.用于衡量众数的代表性II.四分位差1.离散程度的测度值之一2.也称为内距或
4、四分间距3.上四分位数与下四分位数之差QD=QU-QL4.反映了中间50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表性III.方差和标准差(VarianceandStd。deviation)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差IV.偏态(kurtosis)1.数据分布偏斜程度的测度2.偏态系数=0为对称分布3.偏态系数>0为右偏分布4.偏态系数<0为左偏分布I.峰度(skewn
5、ess)1.数据分布扁平程度的测度2.峰度系数=3扁平程度适中3.偏态系数<3为扁平分布4.偏态系数>3为尖峰分布三、描述统计量的软件实现1、Excel选择工具==>数据分析==>描述统计即可输出大部分描述统计量。但EXCEL只能按行或列进行分组统计,因此在编辑数据时要注意。2、SPSSSPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Analyze→DescriptiveStatistics菜单中,最常用的是列在最前面的四个过程:lFrequencies过程的特色是产生频数表;lDescriptives过程则
6、进行一般性的统计描述;lExplore过程用于对数据概况不清时的探索性分析;lCrosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验;l我们常用的X2检验也在其中完成。2.1Frequencies过程此过程可以方便地对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。频数分布表是描述性统计中最常用的方法之一。它还可对数据的分布趋势进行初步分析。【Statistics按钮】lPercentileValues复选框组定义需要输出的百分位数,可计算四分位数(
7、Quartiles)、每隔指定百分位输出当前百分位数(Cutpointsfor equalgroups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5;lCentraltendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum);lDispersion复选框组用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、均
8、值标准误差(S.E.mean);lDistribution复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis);lValuesaregroupmidpoints
此文档下载收益归作者所有