资源描述:
《《线性回归分析》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第三章线性回归分析§3.1一元线性回归模型一、回归分析变量之间的关系,大体分为两类:一类是函数关系;另一类是统计相关关系,或称随机关系。具有相关关系的变量间虽然不具有确定的函数关系,但可以根据大量的统计数据,找出变量之间在数量变化上的统计规律,这种统计规律称为回归关系。用以近似地描述具有相关关系的变量间的函数关系称为回归函数。有关回归关系的计算方法和理论称为回归分析技术。回归分析的主要内容是:1.根据样本观察值对模型参数进行估计,求得回归方程;2.对回归方程、参数估计值进行显著性检验;3.利用回归方程进行预测与控制。二、总体回归方程1、例子假设一个地区的人口总
2、体由60户组成。我们要研究每月家庭消费支出Y与每月可支配家庭收入X的关系。也就是说知道了家庭的每月收入,要预测每月消费支出的(总体)平均水平。为此,将这60户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。表2.1给出了假定的数据.表1.1X,每月家庭收入(元)XY800100012001400160018002000220024002600每月家庭消费支出550600650700750--650700740800850880-790840900940980--80093095010301080113011501020107011001160
3、11801250-110011501200130013501400-12001360140014401450--1350137014001520157016001620137014501550165017501890-1500152017501780180018501910共计325046204450707067807500685010430966012110表2.1表明:对应于每月800元收入的5户家庭的每月消费支出为550到750元不等.类似地,给定X=2400元,6户家庭的每月支出在1370元和1890元之间.即表2.1的每个纵列给出对应于给定收入水平X
4、的消费支出Y的分布.;也就是说,它给出了以X的给定值为条件的条件分布.表2.1的数据代表一个总体.我们可计算出给定X的Y的条件概率.计算如下表2.2表2.2与表2.1的数据相对应的条件概率X800100012001400160018002000220024002600条件概率1/51/51/51/51/5--1/61/61/61/61/61/61/51/51/51/51/1/71/71/71/71/71/71/71/61/61/61/61/61/6-1/61/61/61/61/61/6-1/51/51/51/51/5--1/71/71/71/71/71/71/
5、71/61/61/61/61/61/6-1/71/71/71/71/71/71/7Y的条件均值6507708901010113012501370149016101730如:以上述条件均值作散点图,可以看出,Y的条件均值随X增加而增加,散点图表明这些条件均值落在一条有正斜率的直线上,这条直线叫做总体回归直线,具体描述如下.2、总体回归方程描述两个变量X与Y之间的线性关系可用下列数学式子表示。(2.1.1)(2.1.1)式中一部分是由于X的变化引起Y线性变化的部分,即;另一部分是由其它一切随机因素引起的,记为。(2.1.1)式确切地表达了变量X与Y之间的密切程度,
6、但密切的程度没有达到由X唯一确定Y的地步。(2.1.1)式称为Y对X的一元线性回归理论模型,Y称为被解释变量(因变量),X称为解释变量(自变量),式中是未知参数,称为回归参数,表示随机因素的影响,是一随机变量。一般假定和,在此假定下有,或,称为一元线性总体回归方程,它是解释变量取给定值时因变量的条件均值或条件期望值的轨迹.三、样本回归方程取一个容量为N的样本,代入(2.1.1)式有,(2.1.2)(2.1.2)称为一元线性回归模型.基本假定:1.零均值假定(2.1.3)由于存在随机扰动因素,在期望值附近上下波动,如果回归方程假定正确,相对于的正偏差和负偏差都会
7、发生,随机扰动项ε可正可负,发生的概率大致相同,零均值假定表明平均来看,这些随机扰动项有相互抵消的趋势.2.同方差假定(2.1.4)这个假定表明,对每个,随机扰动项的方差等于一个常数,即解释变量取不同值时,相对各自均值(零均值)的分散程度是相同的,因变量具有与相同的方差.因此,该假定同时表明因变量可能取值的分散程度是相同的。3.无自相关假定(2.1.5)假定表明产生干扰的因素是完全随机的,此次干扰与彼次干扰互不相关,因此变量的序列值之间也互不相关。4.解释变量与扰动项互不相关的假定(2.1.6)这个假定表明与互不相关,即随机扰动项和解释变量是各自独立地对因变量
8、产生影响的。事实上,在回归分析中,在重