§4 逐步回归分析.doc

§4 逐步回归分析.doc

ID:51423450

大小:61.50 KB

页数:4页

时间:2020-03-24

§4 逐步回归分析.doc_第1页
§4 逐步回归分析.doc_第2页
§4 逐步回归分析.doc_第3页
§4 逐步回归分析.doc_第4页
资源描述:

《§4 逐步回归分析.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、§4逐步回归分析学习资料2009-09-2817:27:39阅读624评论2左中尘1、逐步回归分析的主要思路在实际问题中,人们总是希望从对因变量]有影响的诸多变量中选择一些变量作为自变量,应用多元冋归分析的方法建立“最优”回归方程以便对因变量进行预报或控制。所谓“最优”回归方程,主要是指希望在冋归方程屮包含所有对因变量匸影响显著的自变量而不包含对影响不显著的自变量的回归方程。逐步回归分析止是根据这种原则提出來的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对的作用大小,显著程度大小或者说贡献大小,由大到小地逐个引入回归方程,而对那些对•

2、:作用不显著的变量可能始终不被引人冋归方程。另外,己被引人冋归方程的变量在引入新变量后也可能失去重要性,而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除…个变量都称为逐步回归的i步,每…步都要进行F检验,以保证在引人新变量前回归方程中只含有对影响显著的变量,而不显著的变量已被剔除。逐步回归分析的实施过程是每一步都要对已引入冋归方程的变量计算其偏回归平方和(即贡献),然后选一个偏回归平方和最小的变量,在预先给定的水平下进行显著性检验,如果显著则该变量不必从冋归方程屮剔除,这时方程屮其它的几个变量也都不需要剔除(因为其它的儿个变量的偏回归

3、平方和都大于最小的…个更不需要剔除)。相反,如果不显著,则该变量要剔除,然后按偏回归平方和由小到大地依次对方程中其它变量进行,检验。将对,影响不显著的变量全部剔除,保留的都是显著的。接着再对未引人回归方程中的变量分别计算其偏回归平方和,并选其中偏回归平方和最大的一个变量,同样在给定h水平下作显著性检验,如果显著则将该变量引入冋归方程,这一过程一直继续下去,直到在冋归方程屮的变量都不能剔除而又无新变量可以引入时为止,这时逐步回归过程结朿。2、逐步回归分析的主要计算步骤(1)确定三检验值在进行逐步回归计算前要确定检验每个变量是否显若的F检验水平,以作

4、为引人或剔除变量的标准。F检验水平要根据具体问题的实际情况来定。一般地,为使最终的回归方程中包含较多的变量,-水平不宜取得过高,即显著水平a不宜太小。三水平还与自由度有关,因为在逐步冋归过程屮,冋归方程屮所含的变量的个数不断在变化,因此方差分析中的剩余自由度也总在变化,为方便起见常按计算自由度。・••为原始数据观测组数,P为估计可能选人冋归方程的变量个数。例如"%估计可能有2〜3个变量选入回归方程,因此取自由度为15-3-1=11,查f分布表,当a=0.1,自由度为",力川时,临界值热=也,并且在引入变量时,自由度取为=1,舟―Sf检验的临界值记

5、花在剔除变量时自由度取A—-检验的临界值记匚并要求斤洛,实际应用小常取(2)逐步计算如果己计算••步(包含:=0),且回归方程中已引入$个变量,则第:亠:步的计算为:C)计算全部自变量的贡献:-(偏回归平方和)。C)在已引入的自变量中,检查是否有需要剔除的不显著变量。这就要在已引入的变量中选取具有最小:、值的一个并计算其M值,如果"敢表示该变量不显著,应将其从回归方程中剔除,计算转至(匸)。如尸“则不需要剔除变量,这时则考虑从未引入的变量中选出具有最大:-值的一个并计算=值,如果八叭则表示该变量显著,应将其引人回归方程,计算转至(「)。如果Y忙表

6、示已无变量可选入方程,则逐步计算阶段结束,计算转人(3)。“)剔除或引人一个变量后,相关系数矩阵进行消去变换,第:-;步计算结束。其后重复《)〜('•)再进行下步计算。由上所述,逐步计算的每一步总是先考虑剔除变量,仅当无剔除时才考虑引入变量。实际计算时,开头几步可能都是引人变量,其后的某几步也可能相继地剔除几个变量。当方程中已无变量可剔除,且又无变量可引入方程时,第二阶段逐步计算即告结束,这时转入第三阶段。(3)其他计算,主要是计算回归方程入选变量的系数、复相关系数及残差等统计量。逐步回归选取变量是逐渐增加的。选取第/个变量时仅要求与前面己选的「

7、1个变量配合起来有最小的残差平方和,因此最终选出的丄个重要变量有时可能不是使残湼平方和最小的匚个,但大量实际问题计算结果表明,这丄个变量常常就是所有丄个变量的组合中具有最小残差平方和的那…个组合,特别当丄不太大时更是如此,这表明逐步回归是比较有效的方法。引人回归方程的变量的个数丄与各变量贡献的显著性检验中所规定的M检验的临界值耗与E的取值大小有关。如果希望多选一些变量进人回归方程,则应适当增大检验水平a值,即减小斤•弓的值,特别地,当A■月"时,则全部变量都将被选入,这时逐步冋归就变为一般的多元线性回归。相反,如果a取得比较小,即斤与三取得比较大

8、时,则入选的变量个数就要减少。此外,还要注意,在实际问题中,当观测数据样本容量•:较小时,入选变量个数丄不宜选得过大,否则被确定的系数匚

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。