多元线性回归分析ppt课件.ppt

多元线性回归分析ppt课件.ppt

ID:59472323

大小:730.50 KB

页数:53页

时间:2020-09-14

多元线性回归分析ppt课件.ppt_第1页
多元线性回归分析ppt课件.ppt_第2页
多元线性回归分析ppt课件.ppt_第3页
多元线性回归分析ppt课件.ppt_第4页
多元线性回归分析ppt课件.ppt_第5页
资源描述:

《多元线性回归分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多元线性回归分析内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用内容概述-问题-解决方案基本原理数学模型方法步骤逐步回归方法多元相关分析应用xyεx2yεx1x3x2y1ε1x1x3y2ε2一元回归分析多元回归分析多变量回归分析x2y1ε1x1x4y2ε2x3y3ε3路径分析多元统计分析方法架构推断性统计学分析(其他)多因子方差分析多变量方差分析多元线性回归分析广义线性模型分析多元Logistic回归分析Poisson回归模型分析对数线性模型分析生存分析主成分分析聚类分析判别分析典型相关分析

2、路径分析因子分析结构方程模型分析时间序列分析广义估计模型内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用两自变量与应变量的散点图两自变量与应变量的拟合面bj为xj方向的斜率内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用y=0+1x1+...+mxm+ε因变量自变量偏回归系数残差多元线性回归必须满足的假定条件因变量是服从正态分布的连续型随机变量;k个自变量是固定变量,即非随机或无度量误差的变量;k个自变量间不存在多重共线性;k个自变量与残差独立;残差是随机变量,均值为零,方

3、差为常数;各残差间相互独立;残差服从正态分布。因变量是服从正态分布的连续型随机变量;k个自变量是固定变量,即非随机或无度量误差的变量;k个自变量间不存在多重共线性;k个自变量与残差独立;残差是随机变量,均值为零,方差为常数;各残差间相互独立;残差服从正态分布。统计检验结果偏倚结果失真结论的非唯一性模型中缺乏重要变量参数估计偏倚结果误导y=0+1x1+...+mxm+ε自变量的数量化(1)自变量为连续型变量(必要时作变换)(2)自变量为有序变量(依次赋值,如疗效好中差,可分别赋值3、2、1)(3)自

4、变量为二分类(可令男=1,女=0)(4)自变量为名义分类(需要采用哑变量(dummyvariables)进行编码)名义分类变量的哑变量化-假如职业分类为工、农、商、学、兵5类,则可定义比分类数少1个,即4个哑变量。编码方法如下:内容概述基本原理数学模型方法步骤-参数估计-检验参数-检验模型-模型诊断逐步回归方法多元相关分析应用采用最小二乘法参数估计偏回归系数估计残差的标准差估计偏回归系数的标准误估计标准化的偏回归系数用以说明自变量中各自变量对因变量的相对影响大小检验参数偏回归系数的100(1-α)%置信

5、区间检验模型复确定系数调整复确定系数多元线性回归模型方差分析表模型诊断多重共线性检验自变量间存在着相关关系,使一个或几个自变量可以由另外的自变量线性表示时,称为该变量与另外的自变量间存在有共线性(multicollinearity)。多重共线性的识别与解决办法-回归系数的符号与专业知识不符-变量的重要性与专业不符-R2高,但各自变量对应的回归系数均不显著-方差膨胀因子(VarianceInflationFactors,VIF)>10-筛选自变量-用主成分回归-岭回归残差分析-用全部观察对象的资料建立起回

6、归方程后得到的残差称为普通残差。普通残差的敏感性较差,其原因是回归方程中包含了残差所对应的观察点的信息。-另一种残差称为预报残差(predictionresidual),它是用不含该观察点信息的回归方程来计算该观察点的平均预报值所得到的残差,因此能更好地反映出该观察点远离回归线的情况。如果该例的普通残差较小而预报残差很大,则表示该观察点是对回归方程影响较大的特异点,应对该资料的来源作深入的分析。内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用1.前进法(forwardselection)2.

7、后退法(backwardelimination)3.逐步回归法(stepwiseregression)它们的共同特点是每一步只引入或剔除一个自变量。决定引入或剔除基于对偏回归平方和的F检验。内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用偏相关系数几个相关系数的区别简单相关系数复相关系数偏相关系数内容概述基本原理数学模型方法步骤逐步回归方法多元相关分析应用1)确定多个指标变量与一个反应变量之间的线性关系。例如,温度,湿度以及大气污染物的浓度与发病率的关系。2)筛选疾病的危险因素和有利于健康的

8、健康促进因素。例如,在肿瘤、冠心病等疾病的病因研究中,应用多元线性回归分析,可以从众多的相关因素中筛选出疾病的主要危险因素,并估计出这些危险因素的对引起疾病发生的相对重要程度。3)从较易测得的自变量来推测较难测得的自变量。例如,从健康人测得的身高,体重,年龄和身体的表面积的数据回归得到的模型可以用来估计烧伤病人的身体表面积。4)从已发生的x来预测将发生的y。例如,根据病人手术后所观察的一些指标和手术后的存活时间,建立手术后存活时间与这些指标

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。