欢迎来到天天文库
浏览记录
ID:18943209
大小:1.76 MB
页数:64页
时间:2018-09-27
《多元统计分析第四章 多元回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4章多元回归分析简单说,回归分析是根据统计资料建立经验公式的统计方法。例如统计若干焊接点数据,从而建立由焊接点直径预报焊点剪切强度的预报公式;又如统计若干棵松树的胸径与材积(可利用木材体积),建立由胸径预报材积公式,也用到回归分析方法。当然回归分析不只是建立预报公式,还要对预报误差的大小,预报公式的合理性等问题讨论,有着非常丰富的内容。回归分析可用于预测和控制,在自然科学,社会科学和应用技术中都有重要应用,它是统计学最重要的工具。回归分析方法和理论从Gauss提出最小二乘法开始,至今已近200年,目前仍在蓬勃发展
2、,例如在回归诊断、维度缩减、半参数回归、非参数回归、LOGISTIC回归等方向不断有新的突破。本章介绍参数回归分析模型及其参数估计、检验、模型选择等理论和有关计算方法。参数回归分析主要分三类:线性回归、可以转化为线性回归的回归和非线性回归。本章依次介绍这三类模型。有关回归分析的一般理论可参见陈希儒(1984),方开泰(1988),Seber(1976),何晓群(1997),何晓群、刘文卿(2001)、Richard(2003)。Robert(1999)和王吉利(2004)提供了许多有趣的应用例子。4.1多元线性回归
3、模型首先让我们看一个例子:例4.1对15个地区调查某种护肤霜销量得表4-1,其中y表示销量(打),表示目标人口数(千人),表示人均可支配收入(美元)。试建立由目标人口和人均可支配收入预测销量的公式。表4-1护肤霜销量数据销量(打)y目标人口(千人)人均可支配收入(美元)16227424501201803254223375380213120528386786234716926637828198370819233024501161952137555325602524304020232372442714423626601
4、031572088642123702605这个问题中,每个地区销量受该地区目标人口数和人均可支配收入数影响,3个变量y、、间存在密切关系。但是它们的关系不是确定性关系而是相关关系。常见的变量间关系分为两大类:确定性关系和相关关系。确定性关系也称为函数关系。具有确定性关系时,自变量完全确定因变量的值。例如存款的年利率c固定,那么存款数z与总利息y的关系就是确定性关系;z知道后,y就由y=cz确定。又如自由落体的下落高度s与下落时间t的关系也是确定性关系。现实世界中大量存在相关关系,具有相关关系的变量间不能完全确定,例
5、如焊接点直径与焊点剪切强度(焊接点被拉断所用的力)是两个变量,它们关系密切,但是焊接点直径不能完全确定焊点剪切强度,焊接点直径是1毫米的焊点,剪切强度是不确定的。但总起来说,它比焊接点直径是2毫米的焊点,剪切强度要小,统计数据证明焊接点直径与焊点剪切强度近似存在线性关系,焊接点直径与焊点剪切强度就是相关关系。又如学生平时成绩与期末考试成绩关系很密切,但是平时成绩不能完全确定期末考试成绩,平时成绩与期末考试成绩关系就是相关关系。例4.1中,y、、间存在密切关系。但是它们的关系不是确定性关系而是相关关系。具有相关关系的
6、变量间,由一些变量可以大体预报其它变量。前者称为自变量,也叫解释变量或预报因子,例4.1中的和就是自变量;被预报量称为因变量,也叫做响应变量或预报对象,例4.1中的y就是因变量。回归分析的初步目的是,得到由自变量预报因变量的公式,以便通过自变量去预测或控制因变量。对于线性回归模型中的自变量,有两种处理方法:一种当作确定性变量处理,另一种当作随机变量处理,所得计算公式相同。本书采用前一种处理方法。回归分析是建立预报公式的一种方法。其一般步骤是:首先取得自变量和因变量的多次观测值,这些观测值可能是实验得到的,也可能是调
7、查出的;然后根据这些数据确定经验公式的类型,建立数学模型,列出待估参数;再用这些数据进行拟合,得到待估参数的估计值;最后作统计分析。数据拟合是计算方法的内容,它也能解决回归分析中的数据拟合,但回归分析与计算方法的数据拟合不同,计算方法的数据拟合只估计未知参数,而回归分析不仅仅估计参数,而且要对拟合的结果作统计分析。最简单的回归模型是线性回归模型,本节就介绍线性回归模型。我们从例4.1的观测数据出发,建立地区销量由该地区目标人口数和人均可支配收入数预报的经验公式,以此介绍多元线性回归模型建立过程。对例4.1容易看出:
8、目标人口数越多,地区销量越大;人均可支配收入数越大,地区销量越大。但还会遇到随机因素的影响,从而3个变量y、、间是相关关系,于是建立数学模型(4.1)其中是零均值随机变量,称为误差;其方差称为误差方差记为。是未知的参数,如果知道它们的值,预报公式(经验公式)就有了,而且误差的大小也可以估计了,称为待估参数。、作为自变量,其观测值作为固定值。在这个模型中自64
此文档下载收益归作者所有