《-多元线性回归》ppt课件

《-多元线性回归》ppt课件

ID:27628420

大小:670.01 KB

页数:50页

时间:2018-12-01

《-多元线性回归》ppt课件_第1页
《-多元线性回归》ppt课件_第2页
《-多元线性回归》ppt课件_第3页
《-多元线性回归》ppt课件_第4页
《-多元线性回归》ppt课件_第5页
资源描述:

《《-多元线性回归》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十五章多元线性回归暨南大学医学院医学统计教研室林汉生教学要求掌握多元线性回归模型的一般形式熟悉多元线性回归方程的假设检验及其评价方法掌握用SPSS统计软件进行多元线性回归分析熟悉多元线性回归方程的应用及其注意事项教学内容多元线型回归自变量选择方法多元线性回归的应用及其注意事项问题的提出直线回归分析是分析一个应变量Y和一个自变量X之间的数量关系。但通常一个应变量受到许多因素的影响。如:糖尿病患者的血糖可能受胰岛素、糖化血红蛋白、血清胆固醇、甘油三酯等指标影响。儿童血液中血红蛋白(Y)与微量元素:钙(X1),铁(X2)含量的关系。第一

2、节多元线性回归多元线性回归模型多元线性回归方程的建立多元线性回归方程的假设检验及其评价一、多元线性回归模型Y为应变量,X1,X2,…,Xm为k个自变量。b0:常数项b1,b2,…,bk为偏回归系数的估计值它表示在其它自变量固定不变的情况下,xj每改变一个单位时,单独引起的应变量Y的平均改变量。:应变量的估计值二、多元线性回归方程的建立设有n例观察对象,对第i例可求出应变量yi的估计值i,则,全部n例资料的残差平方和为:全部n例资料残差平方和最小的那一组值就是要求的参数估计值。表15-227名糖尿病人的血糖及 有关变量的测定结果序号i

3、总胆固醇甘油三酯胰岛素糖化血红血糖(mmol/L)X1(mmol/L)X2(U/ml)X3蛋白(%)X4(mmol/L)Y15.681.904.538.211.223.791.647.326.98.836.023.566.9510.812.3……………2511.5410.891.2010.520.0265.840.928.616.413.3273.841.206.459.610.4=5.94+0.142x1+0.351x2-0.271x3+0.638x4三、多元线性回归方程的 假设检验及其评价回归方程的假设检验及评价:从总体上分析

4、所有自变量对因变量Y是否有线性回归关系。各自变量的假设检验与评价=5.94+0.142x1+0.351x2-0.271x3+0.638x4(一)回归方程的假设检验及评价方差分析法决定系数R2复相关系数1.方差分析法H0:1=2=…p=0H1:各j不全为0=0.05F0.01(4,22)=4.31。本例F=8.28,P<0.01。认为所拟合的回归方程具有统计学意义。决定系数R2coefficientofdetermination说明自变量X1,X2,…,Xm能够解释Y变化的百分比,其值愈接近于1说明模型对数据的拟合程度愈好。

5、本例R2为0.60,表明血糖含量变异的60%可由总胆固醇、甘油三酯、胰岛素和糖化血红蛋白的变化来解释。决定系数R2与校正决定系数R2adj若引入模型的自变量与应变量没有任何关系或贡献很小,则校正决定系数比决定系数小。若引入模型的自变量与应变量有关系或贡献很大,则两个决定系数接近。3.复相关系数(multiplecorrelationcoefficient)度量应变量Y与多个自变量间的线性相关程度,亦即观察值Y与估计值之间的相关程度。本例复相关系数如果只有一个自变量时,R=

6、r

7、,r为简单相关系数。取值范围0≤R≤1。(二)各自变量的

8、假设检验与评价使回归方程中只包含对应变量有统计学意义的自变量。偏回归平方和(不介绍)t检验法:与偏回归平方和检验完全等价。当回归方程有显著性时,对每个自变量的偏回归系数进行假设检验,当某个自变量的偏回归系数无显著性,则应把该变量剔除,重新建立不包含该自变量的多元线性回归方程。t检验法H0:j=0H1:j≠0=0.05t(bj)=bj/S(bj)服从t(n-p-1)分布本例,t(b1)=0.39,t(b2)=1.72,t(b3)=2.23,t(b4)=2.62t0.05/2,22=2.074,即胰岛素和糖化血红蛋白对血红蛋白的线

9、性回归有统计学意义;而总胆固醇和甘油三酯对血红蛋白的线性回归无统计学意义。标准化回归系数Standardizedcoefficient当比较各自变量对因变量的相对贡献大小时,但由于各自变量的测量单位不同,单从各偏回归系数的绝对值大小评价不妥。必须对各偏回归系数进行标准化处理,即消除测量单位的影响后,才能进行比较。消除测量单位影响后的偏回归系数称为标准化偏回归系数。第二节自变量选择方法在多元线性回归分析时,希望能从众多的自变量中:挑选出对因变量有重要影响的变量剔除对因变量没有影响或影响很小的变量,或与其他自变量相关密切的变量。一、SP

10、SS筛选变量的方法向后剔除法向前引入法逐步筛选法其他1.向后剔除法(backwardselection)先建立一个包含全部自变量的回归方程,然后每次剔除一个对因变量作用最小且无统计学意义的自变量,直到不能剔除为止。当两个变量一起时效果

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。