欢迎来到天天文库
浏览记录
ID:36606958
大小:2.07 MB
页数:37页
时间:2019-05-09
《spss2-描述性统计分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1Spss数据分析第9讲描述性分析2教师信息教师:张晓黎电子信箱:zhangxiaoli@shift.edu.cn办公室:学院楼B420电话:67703854答疑:周四下午在学院楼B420重点与难点理解常用的描述性统计量集中趋势:均值离散趋势:标准差分布形态:偏度、峰度理解各种图形方法对数据统计特征的描述茎叶图箱图了解假设检验1.描述性统计分析概念目的通过变量的描述性统计分析,掌握和了解样本数据的统计特征和总体分布形态,进而更深入地揭示变量变化的规律。方法数据计算:计算描述性统计量的值,准确反映样本数据的统计特征。图形绘制:绘制常
2、见的统计图形,通过图形来直观展现数据的分布特征,比较数据分布的异同。2.频数分析频数分析是统计每一组中观测点的个数,而不考虑其实际取值。了解变量取值的一般特征。如,哪些数值出现的频率高?变量取值的大致范围是什么?考察数据是否符合建模所需的计量模型的假设。评估数据的质量。如,有多少缺失值或者有多少数据录入错误?形式频数分布表频数分布图2.1频数分布表取值不及格及格中等良好优秀合计取值区间0-5960-6970-7980-8990-1000-100频数1919321677百分比1.30%11.69%24.68%41.56%20.78%
3、100.00%累计百分比1.30%12.99%37.66%79.22%100.00%100.00%频数(Frenquency):变量值落在某个区间或者某个取值点的个数。百分比(Percent):各频数占总样本数的百分比。有效百分比(ValidPercent):各频数占有效样本数的百分比。累计百分比(CumulativePercent):各百分比逐级累加起来的结果,最终取值是100。2.2频数分布统计图条形图(BarChart):用条形的长度表示各类别频数的多少,其宽度是固定的各矩形通常是分开排列的;主要用于展示分类数据。饼图(Pi
4、eChart):直方图(Histograms):用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距;由于分组数据具有连续性,各矩形通常是连续排列;主要用于展示数值型数据。示例1-频数分析对语文成绩进行分数分段统计数据文件:3-StudentScore.sav步骤1:对“语文”成绩进行分段Transform→Recode→IntoDifferentVariables…结果保存为3-StudentScore_成绩分段.sav示例1-频数分析步骤2:对“分数分段”进行统计Analyze→Descriptive
5、Statistics→Frequencies…结果保存为3-StudentScore_成绩分段.spo示例2-P36-频数分析中的基本描述性统计量客户满意度的频数统计分析数据文件:HBAT_200.savAnalyze→DescriptiveStatistics→Frequencies…结果保存为:HBAT_200_frequency.spo3.基本描述统计量通过频数分析对数据的总体分布状况有了基本了解之后,通常还需要对定距变量的分布特征有更为精确的认识,这就需要通过计算基本描述统计量等途径来实现。变量分类定类变量:变量的不同取值
6、仅仅代表了不同类的事物,这样的变量叫定类变量。问卷的人口特征中最常使用的问题,而调查被访对象的“性别”,就是定类变量。对于定类变量,加减乘除等运算是没有实际意义的。定序变量:变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。问卷的人口特征中最常使用的问题“教育程度“,以及态度量表题目等都是定序变量,定序变量的值之间可以比较大小,或者有强弱顺序,但两个值的差一般没有什么实际意义。定距变量:变量的值之间可以比较大小,两个值的差有实际意义,这样的变量叫定距变量。有时问卷在调查被访者的“年龄”和“每月平均
7、收入”,都是定距变量。定比变量,有绝对0点,如质量,高度。定比变量与定距变量在市场调查中一般不加以区分,它们的差别在于,定距变量取值为“0”时,不表示“没有”,仅仅是取值为0。定比变量取值为“0”时,则表示“没有”。分类描述集中趋势(CentralTendency)的统计量描述离散趋势(Dispersion)的统计量描述分布形态(Distribution)的统计量3.1描述集中趋势的统计量指一组数据向某一中心集中的程度,即在某一中心附近观测值数目较多,远离该中心的观测值数目较少。平均值(Mean):即算术平均值。易受极端值影响。中
8、位数(Median):把变量的值有序排列,位于中间位置的值即中位数。是位置平均置,不易受极端值的影响。众数(Mode):样本中出现次数最多的值,代表数据的集中程度。求和(Sum):所有变量之和,反映变量的总体水平。3.2描述离散趋势的统计量反映的是
此文档下载收益归作者所有