欢迎来到天天文库
浏览记录
ID:48731648
大小:390.00 KB
页数:60页
时间:2020-01-20
《多重线性回归.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十三章多因素线性回归1主要内容1多重线性回归模型简介2回归系数的估计3多重回归的假设检验4评价回归方程的标准5自变量的筛选6多重线性回归的应用及其注意事项2某地13岁男童身高、体重、肺活量的实测数据编号身高(cm)x1体重(kg)x2肺活量(L)y1135.132.01.753163.646.22.755156.237.12.757167.841.52.759145.033.02.5011165.549.53.0013153.341.02.7515160.547.22.2517147.640.52.0019155.144.
2、72.7521143.031.51.7523160.840.42.7525158.237.52.0027144.534.72.2529156.532.01.753问题身高、体重与肺活量有无线性关系?用身高和体重预测肺活量有多高的精度?单独用身高、或体重是否也能达到同样效果?身高的贡献大,还是体重的贡献大?4一、多重线性回归模型多重线性回归数学模型:Y为因变量的实际观测值X1、X2、…Xm为m个自变量为常数项为总体偏回归系数为残差,Y的变化中不能用现有自变量解释的部分5多重线性回归方程b0为截距(intercept),又称常数
3、(constant),表示各自变量均为0时y的估计值bj称为样本偏回归系数(partialregressioncoefficient),表示在其他自变量固定不变的情况下,自变量xj每改变一个单位时单独引起因变量y的平均改变量。称为y的估计值或预测值(predictedvalue)6举例根据某地29名13岁男童的身高x1(cm),体重x2(kg)和肺活量y(L)建立的回归方程为:当x1=150,x2=32时,表示对所有身高为150cm,体重为32kg的13岁男童,估计平均肺活量为1.9168(L)。7二、回归系数的估计最小二乘
4、法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小8用偏导数方法可得出下列正规方程组9求解正规方程组得偏回归系数10标准化偏回归系数(standardizedpartialregressioncoefficient)无量纲,越大说明相应的自变量xj对y的贡献越大11例20-1总胆固醇和甘油三酯对空腹血糖的影响12三、多重回归的假设检验回归方程(模型)的检验偏回归系数的检验13模型检验方差分析法确定系数法14方差分析法变异分解1.总变异:2.引进回归以后的变异(剩余):
5、3.回归的贡献,回归平方和:15回归方程检验的方差分析表变异来源离均差平方和SS自由度df离均差平方均方MSF回归SS回归KSS回归/KMS回归剩余SS剩余N-K-1SS剩余/(N-K-1)/MS剩余总SS总N-116检验步骤1.建立假设,确定检验水准2.计算F值3.确定P值,得出结论17确定系数法(coefficientofdetermination)确定系数18R2可用于检验多元回归方程H0:2=0;H1:20。检验统计量为:19偏回归系数的假设检验t检验H0:j=0;H1:j0。20偏回归平方和法偏回归平方
6、和:是指将某自变量xj从回归方程中删除后所引起的回归平方和减少的量。21例20-1总胆固醇和甘油三酯对空腹血糖的影响模型检验结果22偏回归系数的t检验结果23偏回归平方和法的检验结果方程内变量方程外变量SS回归偏回归平方和(xj)F(xj)x1,x24.281x2x11.5432.7389.849x1x22.9891.2924.647F0.05,(1,37)=4.1124评价回归方程的标准复相关系数校正复相关系数剩余标准差25复相关系数(multiplecorrelationcoefficient)0≤R≤1R反映的是因变量
7、与所有自变量的总的相关关系,当方程中自变量个数增加时,R总是增加的。当只有一个因变量y与一个自变量x时,R就等于y与x的简单相关系数之绝对值:R=
8、ryx
9、。根据R的大小判断方程的优劣时,结论总是自变量最多的方程最好,用R衡量方程的优劣是有缺陷的。26校正复相关系数Rad当有统计学意义的变量进入方程中,可使Rad增加,而当无统计学意义的变量增加到方程中时,Rad反而减少。Rad是衡量方程优劣的重要指标27剩余标准差剩余标准差小则估计值与实测值接近,反之则估计值与实测值相差较大,它是反映回归方程精度的指标28自变量的筛选全面分
10、析法前进法后退法逐步回归法29全面分析法(最优子集法)从所有可能的变量组合的回归方程中挑选最优者,即把所有包含1个、2个、…直至全部k个自变量的回归方程都计算出来(),挑选剩余标准差最小的。30前进法的基本思想选定一个标准。开始方程中没有自变量(常数项除外)按自变量对y的贡献大小由大到小
此文档下载收益归作者所有