多重线性回归分析

多重线性回归分析

ID:16085885

大小:1.79 MB

页数:153页

时间:2018-08-07

多重线性回归分析_第1页
多重线性回归分析_第2页
多重线性回归分析_第3页
多重线性回归分析_第4页
多重线性回归分析_第5页
资源描述:

《多重线性回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多重线性回归分析例:由于改革开放政策,深圳特区中外来人口大幅度增加,为了考察特区中外来人口对本地经济发展的贡献,深圳特区统计局收集了所属的宝安县在1987年末18个镇的人口与工农业总产值数据(见数据文件reg.sav)。此处把工农业总产值当作因变量(W),而把外地及本地人口数当作两个自变量(Z1,Z2)。(有关统计方法的原理及计算参见孙尚拱,《医学多变量统计与统计软件》,北京医科大学出版社,2000)数据文件reg.sav1.如何估计自变量与因变量之间的相互关系?(估计回归方程)2.哪些自变量对因变量有影响?(影响因素分析)

2、3.哪一个自变量对因变量的影响更重要?(自变量的相对重要性分析)4.如何用自变量预测因变量?(预测分析)(一)多重回归分析的任务(二)多重回归分析的适用条件1.自变量与因变量之间存在线性关系2.残差的正态性3.残差的等方差性4.剔除强影响点(突出点,outliers)5.自变量之间不应存在共线性6.独立性残差:实际测量值和预测值之间的差异关于独立性:所有的观测值是相互独立的。如果受试对象仅被随机观测一次,那么一般都会满足独立性的假定。但是出现下列情况时,观测值不是相互独立的:时间序列、重复测量(某种药物使用后1个月两个月三个

3、月的疗效)等情况。SPSS软件在“LinearRegression:Statistics”对话框中,提供了Durbin-Watson统计量d,以检验自相关系数是否为0。当d值接近于2,则残差之间是不相关的(此指标仅作参考。是否可使用多元分析主要依据实验设计)。1.如何估计自变量与因变量之间的相互关系?(估计回归方程)其中y为实测值,为预测值(predictedvalue)估计模型中系数的方法:最小二乘方法(LeastSquare,LS),即残差平方和最小。b1,b2…..bm称为偏回归系数(partialregression

4、coefficient):当固定其他变量时(扣除其他自变量的影响,即Bm就是已经调整了其他影响因素后的回归系数,故名偏~),xm每增加一个单位,y的增加值都是bm。(一)多重回归分析的任务模型拟和的优良性指标R:复相关系数,反映了Y与M个自变量的总体相关系数;R2:决定系数(RSquare)R2c:调整决定系数(AdjustedRsquare),是对决定系数的修正,是更客观的指标。(若要做预测分析的话,R值的要求较高,应>0.75。0.6凑活,0.3.,0.4预测效果很差。若只是做影响因素分析的话0.5之类都还好)这些指标越

5、接近于1,说明回归模型拟合越好。2.哪些自变量对因变量有影响?(影响因素分析)对回归模型的统计检验当P<0.05,则认为此回归模型有显著性。对自变量的统计检验当P<0.05,则认为此自变量对因变量有影响。自变量的筛选实际应用中,通常从专业知识出发,建立一个简约(parsimonious)的回归模型,即用尽可能少的自变量拟合模型。常用方法(最常用的是2和3,1仍然是单变量思想。注意,选入标准0.05,剔除标准宽些0.10)1.前进法(Forward):逐步增加变量到模型中(由少到多),对已经进入的变量不再剔除;SPSS中默认的

6、选入自变量的检验水准为0.05。2.后退法(Backward):从模型中逐步剔除变量(由多到少),对已经剔除的变量不再进入;SPSS中默认的剔除自变量的检验水准为0.10。3.逐步法(Stepwise):结合了前进法和后退法,变量边进入边剔除。3.哪一个自变量对因变量的影响更重要?(自变量的相对重要性分析)当自变量的量纲相同时,衡量自变量相对重要性的指标:偏回归系数;若偏回归系数的绝对值越大,则相应自变量对因变量的影响就越大。当自变量的量纲不同时,衡量自变量相对重要性的指标:(偏回归系数有量纲,以下指标无,故可用来衡量)标准

7、化偏回归系数(Standardizedregressioncoefficient)、偏相关系数(PartialCorrelation)和部分相关系数(PartCorrelation)。上述指标的绝对值越大,则相应自变量对因变量的影响就越大。标准化偏回归系数:对自变量、因变量作标准化处理后计算的回归系数。偏相关系数:因变量与自变量均扣除其他自变量影响之后,二者之间的相关系数。与简单相关系数(Pearson相关系数)不同;例如:考察因变量Y与自变量X1、X2的多元回归分析,Y与X1的偏相关系数为扣除X2影响后的Y与X1的相关性。

8、Y与X1的简单相关系数为忽略X2影响后的Y与X1的相关性。部分相关系数:自变量扣除其他自变量影响之后,因变量与自变量之间的相关系数。与偏相关系数不同,部分相关系数中因变量未扣除其他自变量的影响。4.如何用自变量预测因变量?(预测分析)当自变量取某个数值时,y的预测值为Y的均数的95%置信区

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。