实验四_线性回归分析解析.pptx

实验四_线性回归分析解析.pptx

ID:52847950

大小:1.39 MB

页数:62页

时间:2020-03-25

实验四_线性回归分析解析.pptx_第1页
实验四_线性回归分析解析.pptx_第2页
实验四_线性回归分析解析.pptx_第3页
实验四_线性回归分析解析.pptx_第4页
实验四_线性回归分析解析.pptx_第5页
资源描述:

《实验四_线性回归分析解析.pptx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、一、实验目的掌握spss绘制散点图和计算相关系数的方法掌握回归分析的一般步骤和回归的统计检验(包括回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验和残差分析)二、实验内容1、练习教材中P264案例8-1,通过绘制散点图,分析家庭收入与打算购买的住房面积存在怎样的统计关系,数据文件为“住房状况调查.sav”图形→旧对话框→散点图→简单分布→定义→把计划面积放入Y轴;家庭收入放入X轴→确定→查看输出窗口→说明大部分的数据点集中在一定区域中,有少部分数据点“脱离”整体数据较远,家庭收入与计划购买住房面积之间存在一定正的弱相关。2、根

2、据教材P274“SPSS计算相关系数的基本步骤”,在练习1绘制散点图的基础上,对于案例8-1,练习通过计算相关系数,判定分析家庭收入与打算购买的住房面积之间相关关系的强弱。分析→相关→双变量→把家庭收入、计划面积放入变量框→确定→查看输出窗口→家庭收入与计划面积的简单相关系数为0.323,存在弱的正相关。P=0<0.01=α,认为两总体不是零相关。3、练习教材中P309案例9-1,掌握线性回归分析的基本操作,理解回归参数的普通最小二乘估计的原理,掌握回归方程的拟合优度检验、回归方程显著性检验、回归系数显著性检验、残差分析的基本概念、原理和判断规

3、则。数据文件为“高校科研研究.sav”分析→回归→线性→把课题总数放入因变量框;把投入人年数、投入高级职称的人数、投入科研事业费、专著数、论文数、获奖数放入自变量框→方法点进入→点统计量→选共线性诊断→继续→确定→查看输出窗口→由于该方程中含有多个变量,所以看调整R方=0.924,拟合优度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较小。回归方程的显著性检验:P=0<α=0.05应拒绝原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。回归系数显著性检验:有的P>α=0.05,因此不拒绝原

4、假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应保留在方程中。从容忍度和方程膨胀因子看,投入高级职称的人年数与其他变量的多重共线性很严重,可考虑剔除该变量。第七个特征根既能解释投入人年数方差的84%,也能解释高级职称的人年数方差的98%,还可以解释专著数方差的44%,这些变量存在多重共线性;5,6,7条件指数都大于10。特征根条件指数方差比(比例之和等于1)1、容忍度是测量解释变量间多重共线性的重要统计量。容忍度的取值范围在0~1之间,越接近于0表示多重共线性越强;越接近于1表示多重共线性越弱。2、方差膨胀因子

5、方差膨胀因子是容忍度的倒数,方差膨胀因子的取值大于等于1。通常,如果膨胀因子大于等于10,说明解释变量xi与方程中其余解释变量之间有严重的多重共线性。3、特征根和方差比特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分(0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线

6、性相关关系。4、条件指数条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。分析→回归→线性→把课题总数放入因变量框;把投入人年数、投入高级职称的人数、投入科研事业费、专著数、论文数、获奖数放入自变量框→方法点向后→点统计量→选共线性诊断、残差的Dubin-Watson→继续→确定→查看输出窗口拟合优度的检验:经过六步,完成回归方程的建立,最终为第六个模型。随着解释变量的不断减少,方程的拟合优度下降了。说明建立回归方程并不是一味追求高的

7、拟合优度为唯一目标的,还要重点考察解释变量是否对被解释变量有贡献。方程的DW检验值为1.747,残差存在一定程度的正自相关。(P296)最终方程为第六个:P=0<α=0.05,被解释变量与解释变量间的线性关系显著,建立线性模型是恰当的。第六个模型:P=0<α=0.05,说明投入人年数与被解释变量间的线性关系显著,它保留在模型中是合理的。最终方程是立项课题数=-94.524+0.492投入人年数意味着投入人年数每增加一个单位会使立项课题数增加0.492个单位。注:通常情况下,即使常数项在模型中不显著,我们也会在模型中保留,去掉它会对模型带来不利的

8、影响。变量的剔除过程,在模型三中,剔除专著数的情况下,如果保留投入高级职称的人年数,那么它的标准化回归系数是-0.439,但P=0.343>α,回归系

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。