欢迎来到天天文库
浏览记录
ID:40228971
大小:287.50 KB
页数:5页
时间:2019-07-27
《回归分析在数模竞赛中的应用-2》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、§4广义线性回归(GeneralizedLinearRegression)一、广义线性回归基本思想下面先看几个例子。例5抛物线的拟合某零件上有一条曲线,可以近似看作是一条抛物线,为了在数控机床上加工这一零件,在曲线上测得个点的坐标,,要求从这个点的坐标出发,求出曲线的函数表达式。显然,这是一个回归分析问题,由于曲线可以近似看作是一条抛物线,因此,回归方程(即曲线的函数表达式)是一个二次多项式。像这种回归方程是一个多项式的回归,称为多项式回归(PolynomialRegression)。虽然多项式回归方程不是线性的,但可以通过变量代换
2、,化成线性形式。令,,原来的回归方程化成了下列形式:,这是一个线性回归方程,可以用前面介绍过的线性回归的方法求出它的解。具体作回归时,所需要的观测数据,用,的数值代入,求得的线性回归方程中常系数的估计,也就是原来的二次多项式回归方程中常系数的估计。例6科布-道格拉斯(Cobb-Douglas)生产函数在经济学中,有一个著名的科布-道格拉斯生产函数,这个函数指出,生产产出与劳动投入、资本投入之间,近似有下列关系:,其中,都是常系数。现测得一组劳动投入、资本投入和生产产出的数据,,要求从这批数据出发,估计常系数的值。这是一个回归分析问题
3、,回归方程为,显然,它不是线性回归方程,但是,如果我们对方程两边同时取对数,得到11,(原来有,误差项为,取对数后有,也有一个误差项,我们把这个误差项记为。)再令,,,,它就化成了一个线性回归方程。用线性回归的方法可以求出它的解。具体作回归时,所需要的观测数据,,用,,的数值代入,计算得到的线性回归方程中常系数的估计,就是原来回归方程中的估计,原来回归方程中的估计,可以通过求得。例7(1992年全国数模竞赛A题)施肥效果分析对2种作物——土豆、生菜,分别施以3种不同数量的肥料——氮、磷、钾,得到一批产量的数据,求施肥量与产量之间的关
4、系。设分别是氮、磷、钾肥的施肥量,是产量。与之间,可能有各种各样的关系,但这种关系显然不会是线性的。比如说,可以考虑下列关系:。这是一个的2次多项式。令,,,,,,,,,它就化成了一个线性回归方程,可以用线性回归的方法求出它的解。例8混合异辛烯催化反应在混合异辛烯催化反应中,反应速度与氢的分压,异辛烯的分压,异辛烷的分压之间,近似有下列关系:,11其中,是常系数。现对作观测,得到观测值,,要求常系数的估计值。对回归方程两边开3次方,再取倒数,得到,再令,,,,,,,,,原方程就化成了下列形式:,这是一个不带常数项的线性回归方程。对于
5、这种回归方程,可以用求线性回归方程的解法,求得它的最小二乘解。作回归计算时,所需要的观测数据,,,,,用,,,,的数值代入,按线性回归方法求得常系数的估计后,从下列各式就可以求出原方程中各系数的估计值:,,,。上面举了几个把非线性回归化为线性回归的例子。一个非线性回归问题,如果能够象上面例子中所介绍的那样,通过适当的变量代换,化为线性回归,则称这种回归为广义线性回归(GeneralizedLinearRegression)。二、广义线性回归的一般形式和解法设自变量与因变量之间,有下列关系:,其中,是已知的一元函数,有唯一的反函数,,
6、,…,是自变量的不含未知参数的函数,是常系数,~是表示误差的随机变量,。11对,进行次观测,得到观测值:,。求的估计,使得下式达到最小:。这就是广义线性回归问题的一般形式。对回归方程的两边同时取反函数,得到。令,,…,,上述方程就化成了线性回归方程。用线性回归的方法可以求出它的解。三、广义线性回归中的加权处理有些广义线性回归问题,化为线性时不需要取反函数,有些则要取反函数。对于要取反函数的广义线性回归问题,其实还有一点必须说明,就是:取了反函数后,得到的新问题并不完全等价于原问题。下面用简化的形式来说明这一点。原问题回归方程为。求的
7、估计,使得下式达到最小:。化为线性后的新问题在原回归方程的两边取反函数,得到。求的估计,使得下式达到最小:。11这两个问题不完全等价。因为变换把曲线变成直线,把原来各观测点到曲线的距离变成了各点到直线的距离。显然,原来各点到曲线的距离并不等于变换后各点到直线的距离,使各点到曲线的距离平方和最小的解,也不等于使各点到直线的距离平方和最小的解,所以,。为了解决这一问题,有人提出一种“加权处理”方法。我们知道,当时,有,即有。现在因为,所以。所以,其中称为权(Weight)。因此,原问题可以近似等价于下列加权回归问题:求的估计,使得下式达
8、到最小:。由于,所以求得的加权最小二乘估计,。这也就是说,加权后得到的解,非常接近于原问题的解,比起不加权得到的解来,要好得多了。不过,加权毕竟是一种近似处理方法,加权后得到的解,也还不能说完全等价于原问题的解,这一点,也是要说明的。
此文档下载收益归作者所有