第章样本描述与数据准备

第章样本描述与数据准备

ID:35810107

大小:348.01 KB

页数:14页

时间:2019-04-19

第章样本描述与数据准备_第1页
第章样本描述与数据准备_第2页
第章样本描述与数据准备_第3页
第章样本描述与数据准备_第4页
第章样本描述与数据准备_第5页
资源描述:

《第章样本描述与数据准备》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第4章样本描述与数据准备样本数据采集到以后,不能立即用于数据分析,因为样本可能存在错误数据、缺失数据或者异常数据,或者采集的数据不符合要求,不具有代表性,这些情况会直接影响到分析结果的准确性和准确性。所以,进行数据分析以前,需要首先了解一下样本数据的基本特征,并对缺失值和异常值等进行适当的处理。第一节样本的描述一、基本数学知识样本数据采集到以后,常用一些统计量描述原始数据的集中程度和离散状况,对数据的总体特征进行归纳。(1)描述中心趋势的统计量算术平均数:样本数据的总和除以数据个数得到算术平均数,算术平均数是描述样本数

2、据中心趋势最常用的统计量,因为具有计算简便、稳定的优点。中位数:将样本数据(假设有个数)按照升序或者降序排列,如果为奇数,则数列中间的数为中位数;如果为偶数,则中位数为居中两数的均值。中位数不如算术平均数稳定,即在同一总体中取相同大小的不同样本时,中位数的变化比算术平均数大。但是中位数不受极值的影响,因而在经济统计中应用较多。众数:样本数据中出现频数最大的那个数称为众数。众数容易理解,但是不容易确定,与中位数一样,不受极值的影响。截尾平均数:将样本数据进行排序后,按照一定的比率去掉两端的某些数,对剩下的数据求平均值,得

3、到截尾平均数。常用的截尾平均数有5%截尾平均数,即两端去掉5%的数据以后剩余的数求平均数。截尾平均数与算术平均数相比,较少受极值的影响。几何平均数:个非负数的几何平均数可以表示为:几何平均数应用于任何两个相邻数之比为常数或者接近常数的数据资料。调和平均数:个数的调和平均数可以表示为:其它中心趋向的度量还有某种四分数、十分数和百分数的平均值。其中,分位数是随机变量的一种数字特征,假设连续型随机变量的密度函数是,给定常数,若满足:则称为的分位数。(2)描述离散趋势的统计量仅仅利用描述中心趋势的统计量,不能够反映整个数据集合

4、的分布状况,具有不同分布的数据可能具有相同的算术平均数、中位数或者众数等。因此,还需要统计量来反映数据与描述中心趋向统计量之间的离散状况。这样的统计量主要包括以下几种:极差:极差是样本数据中最大值与最小值的差值,极值舍弃了最大值与最小值之间的数据信息,仅仅依靠端点值来确定,因而稳定性差。平均差:样本数据中各数据与均值之间差值的平均数称为平均差。平均差应该为0,用它可以检验平均值的准确性。平均绝对差:样本数据中各数据与均值之间的差值的绝对值的均值称为平均绝对差。标准差:方差的平方根称为标准差,标准差是最常用的反映数据离散

5、趋势的统计量。(3)偏度与峰度偏度:偏度是反映数据分布不对称的一个数字特征,其公式:式中,,为变量的阶中心矩。当数据为正态分布时偏度为0。峰度:峰度是以正态分布为标准描述该分布密度的形状为陡峭还是平坦的一个数字特征,计算公式为:当数据呈现正态分布时,峰度为0。二、SPSS实现用鼠标指向Analyze菜单条中的DescriptiveStatistics选项,打开响应的子菜单,该子菜单中提供了多个过程来实现样本数据的描述。下面分别进行介绍。(1)频数分析过程该过程就是通过数据频数分析来达到整理数据的目的,利用该过程,得到一

6、系列描述数据分布状况的统计量。对话框介绍在DescriptiveStatistics子菜单中单击Frequencies选项,打开Frequencies对话框,如下图所示;变量名列表框:对话框左侧的变量名列出了当前数据文件中所有的变量的变量名。Variable(s):在变量名列表框中单击文件名之后,单击对话框中间的箭头按钮,将变量名移到该列表框中。选定变量名后,将对选定变量的数据进行频数分析。Displayfrequencytables:选定此项,将在查看器中显示频数分析表,否则只显示直方图,不显示频数表。Statist

7、ics按钮:单击该按钮,打开Frequencies:Statistics对话框,如下图所示,该对话框中各个选项的意义如下:1.PercentileValues方框:选择方框内的选项,计算并显示分位数。※Quartiles核选框计算并显示四方位数。※CutPoints核选框在后面的窗口中输入数值,假设为(为2到100之间的整数字),则计算并显示分位数。※Percentile(s)核选框在后面的窗口中输入数值,可以有选择的显示百分位数。在窗口中可以输入0到100之间的数字,输入后,单击Add按钮,将对应的百分位数添加到方框

8、内的列表框中,利用Change按钮和Remove按钮,可以对列表框中的选项进行修改和删除。2.CentralTendency方框:选择该方框内的选项,计算并显示描述中心趋势的统计量。※Mean核选框计算并显示样本数据的均值;※Median核选框计算并显示样本数据的中值;※Mode核选框计算并显示样本数据的众数;※Sum核选框计算并

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。