欢迎来到天天文库
浏览记录
ID:44987556
大小:531.00 KB
页数:71页
时间:2019-11-06
《第十章 直线回归与相关分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十章 直线回归与相关分析&10.1回归和相关分析概述&10.2直线回归分析&10.3直线相关分析&10.1回归和相关分析概述一、变量间的关系分为两类:函数关系:完全确定性的关系——可用精确的数学式来表示;统计关系:不存在完全确定性的关系——不能用精确的数学式来表示。统计关系这一类变量间的关系就是统计学中回归分析与相关分析所要讨论的问题。常用x、y来表示两个变量,(x,y)的各对观察值用(x1,y1),(x2,y2),…,(xn,yn)表示。在统计上,x和y变量的关系有两种理论模型:回归模型和相关模
2、型。回归模型(因果关系)中:x表示原因的变量;y是表示结果的变量。回归分析目的:导出由x来预测或控制y的回归方程,即确定当自变量x为某一值时依变量y将会在什么范围内变化。二、回归、相关分析的任务与类型在相关模型中,其x和y变量是平行变化关系,不能区别哪一个是自变量,哪一个是依变量。相关分析目的:确定两个变量在数量关系上的密切程度和性质。不能用一个或多个变量去预测、控制另一个变量的变化。回归分析的类型:一元回归分析(直线和曲线回归分析);多元回归分析(多元线性回归分析和曲面回归分析)。相关分析的类型:
3、直线相关分析;复相关分析。偏相关分析。三、两个变数资料的散点图对具有统计关系的两个变数的资料进行初步考察的简便而有效的方法,是将这两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatterdiagram)。例如:根据散点图可初步判定双变数X和Y间的关系:①X和Y相关的性质(正或负)和密切程度②X和Y的关系是直线型的还是非直线型的③是否有一些特殊的点表示着其他因素的干扰&10.2直线回归分析一、直线回归方程的建立二、直线
4、回归的显著性检验三、直线回归的区间估计一、直线回归方程的建立设变量x与y间存在直线关系,根据n对观察值所描出的散点图如下。图9—2直线回归散点图总体直线回归方程:y=α+βx实际观察值可表示为:yi=α+βxi+i(i=1,2,…,n)i为随机误差,与α、β相互独立,且服从N(0,2)。这就是直线回归的数学模型根据样本实际观察值对α、β以及误差方差2作出估计,即建立样本回归方程并估计出误差的大小。设样本直线回归方程为:总体直线回归方程:y=α+βx其中a是的估计值,称为回归截距;b是β的估
5、计值,称为回归系数,表示自变量每改变一个单位数时,依变量y平均改变的单位数(b>0时,增加;b<0时,减少)是+βxi的估计值回归方程的基本条件(性质):性质1最小;性质2;性质3回归直线通过点。利用最小二乘法,即Q最小的方法求a与b的值。根据微积分学中求极值的原理,将Q对a与b求偏导数并令其等于0:整理后可得:上式叫做a与b的正规方程组。简记为:解之可得:x与y的离均差乘积和,简称为乘积和,记为SPxy。记ssx=∑x2-(∑x)2/n,则a、b是α、β的最小二乘估计也是无偏估计。例[9.1]一
6、些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。表9.1累积温和一代三化螟盛发期的关系积累温(x)35.534.131.740.336.840.231.739.244.2盛发期(y)12169273139-1SAS分析解:上述方程中回归系数b和回归截距a的意义为:b=-1.1当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均
7、将提早1.1天;a=48.5若积温为0,则一代三化螟的盛发期将在6月27—28日(x=0时,=48.5;因y是以5月10日为0,故48.5为6月27—28日)。由于x变数的实测区间为[31.7,44.2],在应用=48.5-1.1x于预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2的区间外延,则必须有新的依据。二、直线回归的显著性检验回归关系的假设测验:对于样本的回归方程,必须测定其来自无直线回归关系总体的概率大小。只有当这种概率小于0.05或0.01时,我们才能冒较小
8、的危险确认其所代表的总体存在着直线回归关系。这就是回归关系的假设测验。回归关系的假设测验有两种方法:t测验或F测验1、回归系数显著性检验──t检验对直线回归系数b的假设检验为:HO:β=0;HAβ≠0。在HO成立的条件下,回归系数b服从t分布。其中,为回归系数标准误。[例9.3]试测验例9.1资料回归关系的显著性。已算得b=-1.0996,SSx=144.6356,sy/x=3.266,故有:查附表4,t0.05,7=2.36,t0.01,7=3.50。
9、t
10、=4.0
此文档下载收益归作者所有