逐步回归PPT课件

逐步回归PPT课件

ID:43182398

大小:616.50 KB

页数:36页

时间:2019-10-01

逐步回归PPT课件_第1页
逐步回归PPT课件_第2页
逐步回归PPT课件_第3页
逐步回归PPT课件_第4页
逐步回归PPT课件_第5页
资源描述:

《逐步回归PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七章逐步回归方法引言在气象预报中,对预报量的预报常常需要从可能影响预报y的诸多因素中挑选一批关系较好的作为预报因子,应用多元线性回归的方法建立回归方程来做预报,但如何才能保证在已选定的一批因子中得到最优的回归方程呢?逐步回归分析方法就是针对这一问题提出的一种常用方法。下面从提出这一方法的基本思路、这一方法的计算过程出发来作介绍。第一节回归系数(预报因子)的显著性检验在多元线性回归方程的建立中,尽管最后都作了方程的统计检验,但并不意味着在p个因子中,每个因子对预报量y的影响都是重要的。需要对每个因子进行考察,若某个因子对预报量y的作用不显著,那么在多元线性回

2、归方程中它前面的系数就可能近似为0,因此,检验某一因子是否显著等价于检验假设:要对作假设检验,自然就要寻找它的样本统计量和与它有关的统计量的分布。因为最小二乘估计的是随机变量的线性函数,由于这些随机变量是遵从正态分布,则也遵从正态分布。在假设条件成立下,统计量遵从自由度为(1,n-p-1)的F分布,其中,为矩阵中对角线上第k个元素。确定信度以后,查表求出标准值,若,说明该因子方差贡献显著,保留该因子,否则可以考虑从回归方程中剔除出去。预报因子数目增多的优缺点:优点:一般而言,回归方程中包含的因子个数越多,回归平方和就越大,残差平方和越小,残差方差的估计就越小

3、,预报值的置信区间就越小,方程一般也较容易通过检验。缺点:但因子数增多,也给方程增加了不少与预报量关系不大的因子,给预报带来下面三个明显缺点:逐步回归的三种方案1、逐步剔除方案2、逐步引进方案3、双重检验的逐步回归方案逐步剔除法1、概念:从包含全部变量的回归方程中逐步剔除不显著的因子。2、方案:假定有4个预报因子,首先用这4个因子建立回归方程,然后对每个因子检查的大小。因为在做单个因子检验时,上式中的分母是不变的(不同因子检验时),因此,只比较各因子的分子部分即可,从它们中找出最小者作F检验。若检验结果显著,则其余因子自然显著;若检验结果不显著,则剔除这一因

4、子,然后对少一个因子的方程重复上一过程。3、因子的方差贡献这一方案的步骤中每次仅比较统计量,这个统计量是十分重要的,常被称为因子的方差贡献,或称为偏回归平方和,记为从中选出方差贡献最小者,记为,再作F检验,检验时使用下面的公式其中,l为检验时回归方程中所含因子个数,表示回归方程含l个变量时的残差平方和。4、存在的三个问题1)因子的方差贡献代表什麽样的意义?2)为何不同时把几个不显著的因子从方程中剔除出去,而是要每次剔除一个?3)在过程中,每剔除一个因子就要重新计算新方程中的回归系数,当因子较多时,计算量很大,如何解决?我们知道,回归平方和是所有因子对预报量的

5、总贡献。所考虑的因子越多,回归平方和越大,若去掉一个因子,回归平方和只会减小,不会增加。减少的数值越大,说明该因子在回归中所起的作用越大,表明该因子越重要,可用此衡量该因子的方差贡献大小。下面介绍这个量的大小。1设为l个变量对应的回归平方和,为l-1个变量,即去掉第k个因子时的回归平方和它们的差就是去掉第k个因子后,回归平方和的减少量。这部分叫做偏回归平方和,可以衡量每个因子在回归中所引起的作用的大小。在剔除因子过程中,假如方差贡献都比较小,我们只能剔除其中的最小者,而不应该全部去掉。因为这两个因子之间可能存在密切相关关系,剔除第一个因子后,其对y的影响可能

6、很大程度转移到第二个因子对y的影响上。所以回归平方和不会因此减小很多。但如果同时去掉两个因子,就会比较多的减少回归平方和,从而影响回归的精度。2新老回归系数之间的关系:当剔除第k个因子后,3逐步引进方法1.概念在一批待选的因子中,考查他们对预报量y的方差贡献,挑选所有因子中方差贡献最大者,经统计检验是显著的,进入回归方程。如从等因子中考察哪个因子方差在一元回归方程中贡献最大,故首先计算:其中,表示回归方程中无任何因子时的回归平方和,此时为0。假如在p个因子中,的方差贡献最大,记为,则据回归系数的检验公式遵从F分布的统计量进行检验:若显著,则引进该因子。设到l

7、步,方程已有l个因子。若考虑从p-l个因子中引进哪个变量时,还是要考察他们各个因子引进后的方差贡献,仍选取最大者,记为,使用统计量作检验,其中表示在将要引入回归方程中的l+1个因子时,回归方程的残差平方和。如此在方程中逐个地引入因子。注意:这样得到的方程并不能保证其中所有因子都是显著的。因为各因子之间存在相关关系,所以引入新变量后,原有的变量就不一定仍然显著。双重检验的逐步回归方案上述两个方案各存在一定缺点:逐步剔除计算量大;逐步引入计算量小,但不一定保证最后的方程是“最优”的。双重检验的基本思想:将因子一个个引入,引入因子的条件是该因子的方差贡献显著;同时

8、,每引入一个新因子,要对老因子逐个检验,将方差贡献变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。