简单回归与相关分析

简单回归与相关分析

ID:42999825

大小:866.50 KB

页数:57页

时间:2019-09-27

简单回归与相关分析_第1页
简单回归与相关分析_第2页
简单回归与相关分析_第3页
简单回归与相关分析_第4页
简单回归与相关分析_第5页
资源描述:

《简单回归与相关分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七章一元回归分析与简单相关分析变量间的关系有两类:一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。如长方形的面积(S)与长(a)和宽(b)的关系可以表达为:S=ab它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。另一类是变量间不存在完全的确定性关系,不能用精确的数学公式来表示。例如:黄牛的体长与体重的关系;仔猪初生重与断奶重的关系;猪瘦肉率与背膘厚度、眼肌面积、胴体长等的关系等等。这些变量间都存在着十分密切的关系,但不能由一个或几个变量的值精确地求出另一个变量的

2、值。统计学中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。相关变量间的关系一般分为两种:1、因果关系。一个变量的变化受另一个或几个变量的影响。如仔猪的生长速度受遗传、营养水平、饲养管理条件等因素的影响;子代的体高受亲本体高的影响。2、平行关系。它们互为因果或共同受到另外因素的影响。如黄牛的体长和胸围之间的关系,猪的背膘厚度和眼肌面积之间的关系等都属于平行关系。统计学上采用回归分析研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分

3、析;研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量(结果)。图7-1x,y的散点图从散点图可以看出:①两个变量间有关或无关。若有关,两个变量间关系类型,是直线型还是曲线型。②两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切)。散点图直观地、定性地表示了两个变

4、量之间的关系。而,根据观测值,可以将两个变量之间的关系定量地表达出来。根据n对观测值所描出的散点图,可以直观看出呈因果关系的两个相关变量y(依变量)与x(自变量)间的关系是直线关系还是曲线关系。由于依变量y的实际观测值总是带有随机误差,因而依变量y的实际观测值yi可用自变量x的实际观测值xi表示为:(i=1,2,…,n)(7-1)其中:x为可以观测的一般变量(也可以是可以观测的随机变量);y为可以观测的随机变量;i为相互独立,且都服从N(0,σ2)的随机变量。这就是直线回归的数学模型。我们可以根据实际观测值对α,β以及方差σ2做出估计。在x、y直

5、角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。设回归直线的方程为:(7-2)其中,a是α的估计值,b是β的估计值。a、b应使回归估计值与实际观测值y的偏差平方和最小,即:根据微积分学中的求极值的方法,令Q对a、b的一阶偏导数等于0,即:min解正规方程组,得:(7-3)(7-4)整理得关于a、b的正规方程组:(7-3)式中的分子是自变量x的离均差与依变量y的离均差的乘积和,简称乘积和,记作,分母是自变量x的离均差平方和,记作SSx。a叫做样本回归截距,是回归直线与y轴交点

6、的纵坐标,当x=0时,=a;b叫做样本回归系数,表示x改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;叫做回归估计值,是当x在在其研究范围内取某一个值时,y值平均数α+βx的估计值。性质1最小;性质2;(7-5)回归方程的基本性质:如果将(7-4)式代入(7-2)式,得到回归方程的另一种形式(中心化形式):性质3回归直线通过点【例7.1】二、直线回归的显著性检验若x和y变量间并不存在直线关系,但由n对观测值(xi,yi)也可以根据上面介绍的方法求得一个回归方程=a+bx。显然,这样的回归方程所反应的

7、两个变量间的直线关系是不真实的。为了判断直线回归方程所反应的两个变量间的直线关系是否真实,我们先探讨依变量y的变异,然后再作出统计推断。图7-4的分解图1、直线回归的变异来源由此图,可以得出→从图7-4看到:上式两端平方,然后对所有的n点求和,则有由于所以于是所以有(7-6)反映了y的总变异程度,称为y的总平方和,记为SSy;反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为SSR;反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和或剩余平方和,记为SSr。(7-8)式又可表示为:(7-7

8、)这表明y的总平方和剖分为回归平方和与离回归平方和两部分。与此相对应,y的总自由度dfy也划分为回归自由度dfr与离回归自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。