SPSS离群值与数学变换

SPSS离群值与数学变换

ID:37391570

大小:870.50 KB

页数:25页

时间:2019-05-12

SPSS离群值与数学变换_第1页
SPSS离群值与数学变换_第2页
SPSS离群值与数学变换_第3页
SPSS离群值与数学变换_第4页
SPSS离群值与数学变换_第5页
资源描述:

《SPSS离群值与数学变换》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实用生物统计分析(六)离群值、数学变换及其他安徽大学生命科学学院数据集合中与其他数据有明显偏离的取值数值上异常偏大或偏小,或根本不可能存在来源:--读数、录入的错误--真实存在的极端现象离群值对统计分析的影响造成参数估计的偏离(means,SD)造成对统计分布的错判影响对统计方法的选择和结果解释(方差齐性)离群值(outliers)依据常识和科学原理判断谬误直接剔除观察个体值偏离均值程度进行推断箱式图观察Z值观察统计检验方法Grubb’stestDixon’sQtestHuber’smethod离群值的认定箱式图推断离群值分别

2、以四分位数(Q3,Q1)为箱型方框的上、下边,以不超出区间[Q1-1.5*IQR,Q3+1.5*IQR]的最大、最小观测值为线的上、下端,超出该区域的数据视为离群值。其中:IQR(interquartilerange)=Q3-Q1SPSS中:GraphsInteractiveboxplot…注:SPSS还定义了所谓极端值,即超出区间[Q1-3*IQR,Q3+3*IQR]范围的数值。箱式图推断离群值数据集:2,57,60,60,65,68,70,71,72,74,74,76,77,98,150,220箱式图推断离群值离群值离

3、群(极端)值离群(极端)值离群(极端)值Z值推断离群值以Z值区间(-3.0,+3.0)为标准,超过者为可能的离群值。这相当于以平均值为中心的99.9%置信区间。SPSS中:AnalyzeDescriptivestatisticsDescriptives…Z值推断离群值勾选,将标准化变量Z值视为变量存入数据列表中Z值推断离群值可以看到,哪怕是220其Z值也只为2.969,未过此标准(>3)。与箱式图相比,Z值法更为保守。原因与算术平均值的特点有关。Grubb’stest推断离群值在线检验:http://www.graphpa

4、d.com/quickcalcs/Grubbs1.cfm220的Z值=2.97>2.59,为离群值(alpha=0.05)。离群值的判定Z值法最保守,原因是Z值本身就受极端值影响较大;上述方法都不是硬性规定,只为参考;对于离群值的判定要慎重,宁可保守,不可贸然删除,对较小数据集(比如<100)尤其如此;不能为追求显著性结论而人为主观地删除某些个离群值,这有违科学道德。数学变换参数性统计分析方法通常对数据的正态性、方差齐性、变量间的线性等有着明确或潜在的要求。若违背了这些前提,可能降低方法的可靠性,甚至导致其完全失效。当数据不满

5、足这些条件,可以尝试通过数学变换加以改善,以达到顺利使用这些统计方法的目的。数学变换数学变换的使用存在争议,实践中也会给结果的解释带来困难。多数参数性方法是相当稳健的,即:对正态性、方差齐性的稍许偏离并不妨碍正常使用,可能因此损失的检验效力对常规分析仍可接受,尤其在样本量较大(n>30)的情况下。除非特别必要,慎用数学变换。数学变换存在下述情况可尝试数学变换:数据极度偏态分布:J型分布或严重左、右偏组间均值与标准差之间存在中度至高度的相关性必须使用多元统计方法,但正态性和线性不满足样本含量少(n<30)且正态性、齐性不满足数学

6、变换常见类型对数变换平方根变换反正弦变换倒数变换或上述变换的组合适合极度偏态分布,组间呈数量级变化适合中度偏态分布,有泊松分布特征适合偏大或偏小的百分数资料适合J型分布资料数学变换举例除草剂试验,响应变量为单位面积杂草数量区组除草剂123451838438771151724224426157313277319157100474175380524516均值428.00369.7586.7579.2527.75标准差291.5282.6847.9633.5514.55均值大,标准差也大,似乎存在相关关系数学变换举例均值与标准差相关

7、系数达到0.825,散点图也看出相关趋势数学变换举例若直接对原始数据进行annova分析,未通过方差齐性检验,说明各组间方差差异不能忽略。数学变换举例对杂草数量作频数分析,可见其分布明显右偏(偏斜度curtosis=3.249>0)。考虑到单位面积杂草数最有可能服从泊松分布(μ=σ2),最适合平方根变换数学变换举例对响应变量取平方根TransformComputevariable…数学变换举例对响应变量取平方根区组除草剂12345128.9520.938.7710.724.12220.5421.027.817.555.5731

8、6.6417.8612.5310.006.86413.2316.737.216.714.00均值19.8419.149.088.755.14标准差6.772.172.391.921.34TransformComputevariable…转换后的相关系数0.693,有所改善数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。