实验十三-多重线性回归与相关课件.ppt

实验十三-多重线性回归与相关课件.ppt

ID:56984193

大小:295.50 KB

页数:28页

时间:2020-07-25

实验十三-多重线性回归与相关课件.ppt_第1页
实验十三-多重线性回归与相关课件.ppt_第2页
实验十三-多重线性回归与相关课件.ppt_第3页
实验十三-多重线性回归与相关课件.ppt_第4页
实验十三-多重线性回归与相关课件.ppt_第5页
资源描述:

《实验十三-多重线性回归与相关课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实习十三多重线性回归与相关目的要求掌握使用reg过程来筛选自变量,使用选择项selection,sle,sls等选择项筛选自变量并对结果做分析。1多重线性回归的条件线性(linear)独立性(independent)正态性(normal)等方差性(equalvariance)恰好为“LINE”。2多重线性回归的假设检验整体回归效应的假设检验---方差分析偏回归系数的假设检验---t检验(1)回归方程的方差分析(2)各回归系数的t检验检验假设:H0:βi=0H1:βi≠0=0.05。检验统计量:3自变量的筛

2、选(1)自变量筛选的标准与原则:1)残差平方和SSE缩小、确定系数R2增大;2)残差均方MSE缩小、调整确定系数增大。3)Cp准则(C即criterion,p为所选模型中变量的个数)因确定系数会随着回归方程中自变量的增多,而只增不减,不利发现对因变量贡献极小的自变量。如果p自变量的模型是合适的,则其残差均方,便会接近全变量时的残差均方,Cp接近p+1。(2)自变量筛选的常用方法所有可能自变量子集选择法(allpossiblesubsetsselection)前向选择法(forwardselection)后向

3、选择法(backwardselection)逐步选择法(stepwiseselection)4相关系数确定系数R2:表示回归SS占总SS的比重。取值范围为0≤R≤1。反映模型的拟合优度,其值越大越好。调整的R2:,考虑了自变量个数的影响。复相关系数:说明所有自变量与Y间的线性相关程度。即(回归估计值)与Y间的相关程度。偏相关系数:扣除其他变量的影响后,变量Y与X的相关,称为Y与X的偏相关系数。5.SAS应用SAS简明教程P72例8.4为考察肺活量(oxygen)与年龄(age)、体重(weight)、1.5

4、英里跑时间(runtime)、休息时脉搏(restpulse)、跑步时脉搏(runpulse)和跑步时最大脉搏(maxpulse)之间的关系,以便根据训练测试的数据来预报肺活量。测量所得的数据见表8-4,试进行多重线性回归分析。回归分析:1.对偏回归系数进行假设检验2.自变量筛选后,建立回归模型表8-4肺活量及有关变量的测量数据datafitness;inputAgeWeightOxygenRunTimeRestPulseRunPulseMaxPulse@@;cards;4489.4744.60911.37

5、621781824075.0745.31310.07621851854485.8454.2978.65451561684268.1559.5718.1740166172……;procregdata=fitness;modelOxygen=RunTimeAgeWeightRunPulseMaxPulseRestPulse/clb;run;回归效应进行方差分析回归系数进行t检验β0β1β2β3β4β5β6决定系数,说明方程所占的变异占总变异的百分比结果解释回归模型的方差分析:经方差分析,得到F=22.43,P<

6、0.0001,按0.05的水准拒绝H0,回归模型有统计学意义。回归系数进行t检验:发现weight和restpulse的P值为0.1869、0.7473,按α=0.05的水准不拒绝H0,回归系数差异无统计学意义,可以认为这两个变量对oxygen没有影响。datafitness;inputAgeWeightOxygenRunTimeRestPulseRunPulseMaxPulse@@;cards;4489.4744.60911.37621781824075.0745.31310.07621851854485

7、.8454.2978.65451561684268.1559.5718.1740166172……;procregdata=fitness;modelOxygen=RunTimeAgeWeightRunPulseMaxPulseRestPulse/selection=stepwisesle=0.10sls=0.10cliclm;run;纳入变量后,对模型贡献的F与F(in)比较的P值小于0.10可纳入。剔除变量后模型损失的F与F(out)比较的P值大于0.10可排除。通过逐步筛选法进行自变量筛选结果TheRE

8、GProcedureModelDependentVariable:OxygenOutputStatisticsDependentPredictedStdErrorObsVariableValueMeanPredict95%CLMean95%CLPredictResidual144.609044.78080.568543.618045.943539.047950.5136-0.1718245.313049.0845

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。