欢迎来到天天文库
浏览记录
ID:51135617
大小:270.00 KB
页数:9页
时间:2020-03-19
《高级生物统计课件第二讲逐步回归分析.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第二讲逐步回归分析STEPWISEREGRESSIONANALYSIS基本知识:一、适宜资料:多个自变量对一个依变量的影响呈线性回归模型的多变量资料。二、分析目的:建立多元线性回归方程,分析多个自变量对一个依变量的综合作用及各自变量的绝对作用(bi),从而发现规律,以利预测和控制。三、分析思路:将偏回归平方和(作用)最大且显著的自变量依次(逐步)引入回归方程,同时在每步中剔除不显著的自变量,直至既无显著的自变量可引入,又无不显著的自变量可剔除为止,这时的回归方程即为最优回归方程,即“有进有出”的思路。“最优”:回归方程中只包含所有
2、有显著影响的自变量。四、分析方法:主要采用消元变换法解相关阵,共有六步(见后)。在多元线性回归分析时,为建立一个较为简化又能准确预测依变量的最优回归方程,通常是逐个剔除复回归方程中经检验对y影响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也是建立最优回归方程的一种分析法。此类分析法还很多,它们多适用于自变量个数较少,或大多数自变量对y有显著影响的资料分析。否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自变量与y影响程度的大小,逐个地由大至小将自变量引入回归方程。而每引入一个自变量,都要对方程中的各个自变量作显著
3、性检验。检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中的自变量均检验为显著后,再引入另一个与y影响最大的变量,并进行显著性检验。如此反复,直至没有自变量可再被引入,而方程中所有自变量均与y存在显著的线性关系为止。第一节逐步回归分析的基本方法逐步回归分析的基本方法可以通过一个实例介绍其分析步骤。例1为考察舍内干球温度(x1)、湿球温度(x2)、露点温度(x3)、相对湿度(x4)及舒适度指数(x5)对罗曼蛋鸡产蛋率(y)的影响。随机抽测12个位点各64只鸡在56—6
4、7周令的平均周产蛋率如表1—1。表1—1各变量的观察值、平均数及标准差n=12周令x1,℃x2,℃x3,℃x4,%x5y,%565758┇65666722.117.420.1┇13.813.013.416.712.615.7┇9.49.410.713.39.012.5┇5.26.48.358.458.660.2┇58.060.471.268.662.266.4┇57.356.758.070.966.764.3┇60.560.558.917.213.310.364.462.563.49s4.13.84.47.05.63.8一、计算相
5、关系数阵1、计算各变量的平均数(为表1—1)设自变量x1,x2,…,xm与依变量y存在线性关系,m元线性回归方程为:(1—1)(1—2)若有n对观察值:xk1,xk2,…,xkm,yk,k=1,2,…,n则各变量平均数:i=1,2,…,m(1—3)(1—4)本例计算结果列于表1—1。2、计算离差阵自变量平方和ssi,自变量间及其与依变量间的乘积和SPij及SPiy由下式算出:(1—5)i、j=1,2,…,m,i≠j(1–6)(1—7)同一元线性回归分析一样,多元线性回归方程的建立也必须使离回归平方和最小即=最小,若令,则有:最小要
6、使为最小,就必须使b1、b2、……bm的偏微分方程皆等与零,即有:经整理可得方程组:9由于于是可得正规方程组:(1—8)本例m=5,n=12算得:(1—9)3、计算相关系数阵在逐步回归中,为便于计算和表达,通常将离差阵化为相关阵,计算公式为:rij=spij/(ssissj)1/2i、j=1,2,…,m,y(1—10)rij为x1,x2,…,xm,y间的相关系数,且rii=1,于是正规方程组(1—8)可改写为:(1—11)本例由公式(1-10)算得:(1—12)方程组(1—12)中的pi与方程组(1—8)中bi间的关系为:bi=p
7、iSy/Sxii=1,2,…,m(1—13)式中Sxi,Sy为各自变量、依变量的标准差。二、确定显著的F检验水准9为引入有显著作用的自变量,在进行逐步回归计算前,先要确定显著的F检验水准,作为引入或剔除变量的标准。F检验水准要根据具体情况而定。一般地,为使回归方程中包含较多的自变量,显著水准α不要定的太小。显著水准F的取值与自由度有关,而且在逐步回归的分析中,由于自变量引入和剔除的变化,其剩余自由度也在不断变化,若样本的观察数为n,自变量的个数为m,则剩余自由度为n-m-1。如果n相对较大,m与n就相差较大。m个自变量被引入的个数
8、的多少对剩余自由度的影响也就不会太大。此时可确定一个固定的F检验值,不必每次查表更换之。但本例n=12,m=5,剩余自由度分别为6、7、8、9、10。其F值相差不太大,故可选一个共用检验的F值,作为引入和剔除自变量的标准。同时也要注意显著水准α的选
此文档下载收益归作者所有