大数据正态性检验及正态转化在spss中地实现

大数据正态性检验及正态转化在spss中地实现

ID:30226734

大小:4.59 MB

页数:9页

时间:2018-12-27

大数据正态性检验及正态转化在spss中地实现_第1页
大数据正态性检验及正态转化在spss中地实现_第2页
大数据正态性检验及正态转化在spss中地实现_第3页
大数据正态性检验及正态转化在spss中地实现_第4页
大数据正态性检验及正态转化在spss中地实现_第5页
资源描述:

《大数据正态性检验及正态转化在spss中地实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据正态性检验及正态转换在spss中的实现1数据正态性检验1.1观察分布,预先判断主要观察直方图,以及根据峰度和偏度粗略估计研究变量的分布。采用spss中描述统计中的频率分析来实现,具体操作如下:(1)在spss中打开数据资料文件,依次点击“分析—描述统计—频率”,如下图:(2)在弹出的对话框中,选择左边方框中要研究的变量,点击中间的箭头,将其选入右边的对话框,本文选择“胫围”作示例分析,如下图:(1)之后,选择最右边五个选项卡中的“统计”选项卡,在弹出的对话框中的右下角勾选“偏度”和“峰度”选项,点击“继续”,如下图:(2)再点击“图表”选项卡,在弹出的对话框中勾选“

2、直方图”和“在直方图中显示正态曲线”选项,点击“继续”,如下图:(1)然后点击“确定”选项,得出如下结果:统计一栏中包括有偏度及其标准误差、峰度及其标准误差。由结果可知:2.486(偏度)>1.96*0.061(偏度标准误差);23.951(峰度)>1.96*0.126(峰度标准误差),推测该胫围数据不符合正态分布。1.2正态分布显著性检验采用spss中非参数分析方法对数据资料进行正态性检验,具体步骤如下:(1)在spss中打开数据资料文件,依次点击“分析—非参数检验—单样本k-s”,如下图:(2)在弹出的对话框中,选择左边方框中要研究的变量,点击中间的箭头,将其选入右

3、边的对话框,本文选择“胫围”作示例分析,如下图:(1)之后,点击最右边的“精确”选项卡,在弹出的对话框中有三个选项,1、“仅渐进法”:是基于渐进分布的显著性水平的检验指标,适用于大样本,如果样本过小或者分布不好,就会影响检验的效力;2、“蒙特卡洛法”:适用于精确显著性水平的无偏估计,如果样本过大,数据处理过程太长,就应该使用这个选项;3、“精确”:精确计算概率值,可以设定数据处理的时间,如果数据处理时间超过了所设定时间30分钟,就应该使用“蒙特卡洛法”。本文选择“仅渐进法”进行正态显著性检验,点击继续,如下图:(1)然后,点击“选项”的选项卡,在弹出的对话框中勾选要输出

4、的参数,可以全部勾选,本文仅勾选“描述”和“按检验排除个案”,点击“继续”,如下图:(2)点击“确定”,弹出如下结果。由结果可知:渐近显著性(双尾)=0.000<0.05,拒绝原假设,说明该胫围数据分布不符合正态分布。2数据正态转换2.1数据正态转换的方法变量数据转化为正态分布,需要根据原始变量及其分布形状确定相应的转换公式,常用的变量正态变换方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等。1、对数变换:即将原始数据X的对数值作为新的分布数据:X’=lgX。当原始数据中有小值及零时,亦可取X=lg(X+1),还可根据需要选用X’=lg(X+k)或X’=lg(k

5、-X)。对数变换常用于:(1)使服从对数正态分布的数据正态化。如环境中某些污染物的分布,人体中某些微量元素的分布等,可用对数正态分布改善其正态性。(2)使数据达到方差齐性,特别是各样本的标准差与均数成比例或变异系数CV接近于一个常数时。2、平方根变换:即将原始数据X的平方根作为新的分布数据:X’=sqrt(X)。平方根变换常用于:(1)使服从泊松分布的计数资料或轻度偏态资料正态化,可用平方根变换使其正态化。(2)当各样本的方差与均数呈正相关时,可使资料达到方差齐性。3、倒数变换:即将原始数据X的倒数作为新的分析数据:X’=1/X。倒数变换常用于资料两端波动较大的资料,可

6、使极端值的影响减小。4、平方根反正弦变换:即将原始数据X的平方根反正弦值作为新的分析数据:X’=sin-1sqrt(X)。平方根反正弦变换常用于服从二项分布的率或百分比资料。一般认为等总体率较小如<30%时或较大(如>70%时),偏离正态较为明显,通过样本率的平方根反正弦变换,可使资料接近正态分布,达到方差齐性的要求。上述公式只能减轻或消除变量的正偏态,但如果用于负偏态的变量(即不观察偏态和峰度),则会使负偏态变得更加严重。如果是负偏态的分布,则需要先对原始变量做反向转换,即将所有的值反过来,如将最大值变成最小值、最小值变成最大值等等。一般而言,根据原始数据分布来选择转

7、换方法:(1)如果是中度偏态(如偏度为其标准误差的2-3倍),可以考虑取根号值来转换。(2)如果是高度偏态(如偏度为其标准误差的3倍以上),则可以取对数,其中又可分为自然对数和以10为基数的对数,两者区别在于以10为底数的对数比自然对数的纠偏作用更强,甚至会将正偏态转换为负偏态。2.2数据正态转换在spss中的实现(1)以上文的胫围数据为例,在spss中打开胫围数据资料,依次点击“转换--计算变量”,如下图:(2)弹出如下对话框。首先,在“目标变量”对话框中填入所要转换成的变量名称,方便理解,本文以胫围为例,将转换成的变量名称设为“胫围(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。