《逐步回归分析》PPT课件

《逐步回归分析》PPT课件

ID:39163036

大小:2.74 MB

页数:52页

时间:2019-06-26

《逐步回归分析》PPT课件_第1页
《逐步回归分析》PPT课件_第2页
《逐步回归分析》PPT课件_第3页
《逐步回归分析》PPT课件_第4页
《逐步回归分析》PPT课件_第5页
《逐步回归分析》PPT课件_第6页
《逐步回归分析》PPT课件_第7页
《逐步回归分析》PPT课件_第8页
《逐步回归分析》PPT课件_第9页
《逐步回归分析》PPT课件_第10页
资源描述:

《《逐步回归分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第6章逐步回归分析多元逐步回归方法的基本思路:自动地从大量的可供选择的变量中选取最重要的变量,据以建立回归分析的预测或者解释模型。变量选取的根据是自变量对因变量作用程度的大小:保留作用程度大的变量,剔除作用小的变量。是否选取一个变量,定量判据之一就是相关系数。假定有m个自变量,1个因变量(用y表示),则全部变量(包括自变量和因变量)之间的相关系数矩阵可以表作§6.1基本原理根据相关系数定义一个自变量的“贡献”系数——按照贡献系数的大小决定一个自变量的去留。式中Pj表示第j个自变量对因变量的贡献系数,Rjy表示第j个自变量与因变量的相关系数,Rjj表示相关系

2、数矩阵对角线上第j行第j列元素(j=1,2,…,m)。——第l步计算的贡献系数表示为在逐步回归分析过程中,我们不仅要引入贡献最大的自变量,同时要考虑剔除贡献最小的因变量。因此,变量的存留与否又涉及到另一个统计判据——F检验。设定一个显著性水平α,查F检验表,找到F检验的临界值Fα。在第l步计算中,假如第v个自变量的贡献系数最大,数值为根据F检验来判断该自变量是否应该被引入模型。式中h为尚且没有被引入模型的变量序号,v为选出的变量对应的原始变量序号(v=1,2,…,m)。计算变量引入的F值判断公式如下式中n为样品个数,l为计算步骤数,为第v个变量第l步的贡献系

3、数,Ryy为因变量的自相关系数。如果Fin>Fα,则在这个显著性水平下,该变量可以被引入模型,否则不要引入。——在第l步计算中,如果第v个自变量的贡献系数为——则可以根据F检验来判断该自变量——包括已经引入的变量——是否应该被剔除。计算变量剔除的F值判断公式如下如果Fout≤Fα,则在这个显著性水平下,该变量应该被剔除,否则就要保留。在整个逐步回归计算过程中,变量的引入和剔除在两端同时进行。像这样循环往复地计算,直到所有该引入的变量都被引入,该剔除的变量均被剔除为止。6.2.1数据准备§6.2计算方法借助一个简单的实例说明逐步回归分析的方法。问题是山东省淄博

4、市旅游业的发展分析,我们想搞清楚哪些因素影响淄博市的旅游总收入(表6-2-1)。所能考虑的因素包括:国内游客数量、海外游客数量、第三产业的发展和人均GDP数量(m=4)。从1995年到2004年一共10个年份的数据(n=10)。这些因素都与旅游业总收入具有明确的关系。而且,作为自变量,它们彼此之间也有很强的关系。如果将这四个变量全部引入模型,就会导致多重共线性的问题。为了得到简约、可靠的模型,需要借助逐步回归分析技术。为了更为有效地说明问题,我们对表6-2-1的变量排列顺序稍作调整(表6-2-2)利用表6-2-2的数据,容易计算相关系数,得到矩阵如下(表6-

5、2-3)。逐步回归计算就是从这种相关系数矩阵出发的。将这个矩阵记为首先设定F统计量的临界值。取显著性水平α=0.05,我们有m=4个自变量,n=10个观测值。不妨取回归自由度为4、剩余自由度为n-m-1=10-4-1=5的临界值为我们引入变量的F值下限,即取Fc(in)=5.192。另一方面,假定一个变量被淘汰,则有m’=3。我们取显著性水平α=0.05、回归自由度为3、剩余自由度为n-m’-1=10-3-1=6的F临界值为剔除一个变量的上限,即取Fc(out)=4.757。这一步的计算可以分解为如下几个步骤。6.2.2第一轮计算(1)计算自变量的贡献系数(

6、2)找出最大和最小贡献系数及其对应的变量序号显然,等于0.98246最大,对应的变量序号v=1。因此,首先考虑引入的变量是国内游客数量x1;等于0.92574最小,对应的变量序号v=4。故这一步可以考虑将人均GDP即变量x4剔除。国内游客数量这个变量是否能被引入模型,还要进行一次F检验。对于我们的问题,n=10,现在计算第l=1步。(3)计算变量引入和剔除的F统计量根据这个数值远远大于我们设定的临界值Fc(in)=5.192,因此变量x1可以被引入模型。接下来考虑排除贡献系数最小的变量。但是否排除,要视Fout值而定。根据上述计算结果,0.92574最小,由

7、式下面公式这个数值高于剔除变量的F临界值4.757,因此第一步不能剔除。作为对比,可以计算出所有变量的F变化值。例如,对于第二个变量“第三产业产值”,变量引入和剔除的F值分别为(4)相关系数矩阵变换,将化为假定第v个变量在第l步被引入,则相关系数矩阵的第v个元素称为主元。矩阵变换是围绕主元进行的。相关系数矩阵的变换公式如下式中j、k分别为相关系数矩阵的行列编号。根据这个公式,第一步应该改变非主元所在的行、列的元素(j≠v,k≠v),第二步改变主元所在的行的元素(j=v,k≠v),第三步改变主元所在的列的元素(j≠v,k=v),第四步改变主元本身(j=v,k=

8、v)。——首先变换非主元所在的行和列的元素。我们的主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。