欢迎来到天天文库
浏览记录
ID:62075043
大小:92.65 KB
页数:9页
时间:2021-04-16
《Excel中自动完成方差齐性与非齐性t检验.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1、缺失值处理 缺失值是数据分析中一个非常常见的现象,出现的主要原因有:设备故障、拒绝回答、测验时走神等,对此应对缺失值的进行检测,SPSS默认缺失值以黑点表示,可以通过快速浏览数据列表发现,记录下缺失值所在的变量即数据的列。 缺失值的处理方式有以下三种: (1)剔除有缺失值的观测单位,即删除SPSS数据列表中缺失值所在的数据行。 在SPSS的统计分析程序中,打开options按钮,便会出现缺失值的处理栏,可分别选择下列选项:“剔除正在分析的变量中带缺失值的观察单位”、“剔除所有分析变量中带缺失值的观察单位”。虽然这种做法可以为执行许多统计分析命令扫清障碍,但要求每一步统计分析都
2、联系于特定的有效样本容量,而样本容量不能稳定会给整个分析带来不便。 (2)对缺失值进行估计后补上。 主要有两种方法:一是根据文献报道等知识经验进行估计;二是用SPSS提供的工具进行估计。在“transform”菜单下的“replacemissingvalues”列出了5种替代的方法: 1)seriesmean:以列的算术平均值进行替代; 2)meanofnearlypoint:以缺失值邻近点的算术平均值进行替代; 3)Medianofnearlypoint:以缺失值临近点的中位数替代; 4)linearinterpolation:根据缺失值前后的2个观察值进行线性内查法估计和
3、替代; 5)lineartrendatpoint:用线形回归法进行估计和替代。 (3)将缺失值作为常数值,如:作为“0”。 2、奇异值和极端值的处理 奇异值和极端值是指各变量中与整体数据相距太远的极值,由于它的夸大作用,常常会歪曲统计结果,导致犯一类和二类错误。 导致奇异值和极端值的原因:(1)数据输入时出错;(2)在不同数据格式之间进行转换时,缺失值处的数码代号被当成了实际观测值;(3)出现奇异值的样本并非属于所要考察的总体;(4)考察的样本相对于正态分布有比较多的极值。 奇异值和极端值的检测: 在描述统计分析菜单下,点击Explore(探索性分析)对话框后把变量选入Va
4、riables框中,单击统计量选择描述统计量,单击图可以选择箱形图、茎叶图、直方图与正态检验的Q-Q图等检测有无极端值和奇异值。通过箱形图可以发现数据中的异常点,对数据进行核对、检验和筛选。以箱形图为例,箱形图中都标有奇异值的行号。箱形图图形的含义是:中间的粗线为中位数,灰色的箱体为四分位,两头伸出的线条表现极端值(下线为最小值、上线为最大值)。箱形图用离群值和极端值表示那些在绳索外侧的值。离群值,是指值与框的上下边界的距离在1.5倍框的长度到3倍框的长度之间的个案,在图种用“o”号表示。极端值是指值距离框的上下边界超过3倍框长的个案,用“*”号表示。框的长度是四分位数之间的全距。 如图
5、1所示,对某问卷中家庭收入进行分析的箱形图中既有离群值也有极端值。图中3个极端值分别位于:81号家庭、93号家庭、62号;此外2个离群值为:67号家庭、76号家庭。有时,鉴于81号家庭远远游离于箱体、绳索及邻近的极端值所组成的群体之外,可以把它视作飞点。 减少奇异值和极端值影响的方法: (1)将奇异值和极端值作为缺失值处理:在“variableview”视图中点击“missing”栏下含有奇异值和极端值的变量,弹出“missingvalues”对话框,有3个选项可以使用:1)“discretemissingvalues”最多可以指定3个数值为缺失值;2)“rangeofmissing
6、values”指定某一取值范围内的数值为缺失值;3)“rangeplus oneoptionaldiscretemissing”指定某一取值范围和某一特定数值为缺失值; (2)根据检测的奇异值和极端值,用“dataselectcases”工具中的“if…”对数据的取值范围进行限定,然后再进行统计分析; (3)对奇异值进行估计,方法同缺失值的估计; (4)将原始数据转换成标准Z分数(statis-tics/summarize/descriptives/save/standardizedvalueas)或进行其他的转换后再进行统计分析; (5)删除奇异值所在的观察单位。 3、统计分
7、析前的假设检验 许多统计检验都需要样本数据服从正态分布,并且相关联的变量之间应方差齐同。若不符合上述条件便应进行数据转换,否则便会导致错误。但大样本数据可以近似地认为其为正态分布,而不用去进行正态性检验。“analyze”下的“descriptives”,“frequencies”和“explore”可以完成这些工作。 (1)方差齐性检验(spreadvs.levelwithlevenetest) “descriptives”
此文档下载收益归作者所有