回归分析方法总结全面

回归分析方法总结全面

ID:14694745

大小:238.54 KB

页数:10页

时间:2018-07-30

回归分析方法总结全面_第1页
回归分析方法总结全面_第2页
回归分析方法总结全面_第3页
回归分析方法总结全面_第4页
回归分析方法总结全面_第5页
资源描述:

《回归分析方法总结全面》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、什么是回归分析回归分析(RegressionAnalysis)是研究变量之间作用关系的一种统计分析方法,其基本组成是一个(或一组)自变量与一个(或一组)因变量。回归分析研究的目的是通过收集到的样本数据用一定的统计方法探讨自变量对因变量的影响关系,即原因对结果的影响程度。回归分析是指对具有高度相关关系的现象,根据其相关的形态,建立一个适当的数学模型(函数式),来近似地反映变量之间关系的统计分析方法。利用这种方法建立的数学模型称为回归方程,它实际上是相关现象之间不确定、不规则的数量关系的一般化。二、回归分析的种类1.按涉及自变量的多少,可分为一元回归分析和多元回归分析一元回归分析是对一

2、个因变量和一个自变量建立回归方程。多元回归分析是对一个因变量和两个或两个以上的自变量建立回归方程。2.按回归方程的表现形式不同,可分为线性回归分析和非线性回归分析若变量之间是线性相关关系,可通过建立直线方程来反映,这种分析叫线性回归分析。若变量之间是非线性相关关系,可通过建立非线性回归方程来反映,这种分析叫非线性回归分析。三、回归分析的主要内容1.建立相关关系的数学表达式。依据现象之间的相关形态,建立适当的数学模型,通过数学模型来反映现象之间的相关关系,从数量上近似地反映变量之间变动的一般规律。2.依据回归方程进行回归预测。由于回归方程反映了变量之间的一般性关系,因此当自变量发生变化时

3、,可依据回归方程估计出因变量可能发生相应变化的数值。因变量的回归估计值,虽然不是一个必然的对应值(他可能和系统真值存在比较大的差距),但至少可以从一般性角度或平均意义角度反映因变量可能发生的数量变化。3.计算估计标准误差。通过估计标准误差这一指标,可以分析回归估计值与实际值之间的差异程度以及估计值的准确性和代表性,还可利用估计标准误差对因变量估计值进行在一定把握程度条件下的区间估计。四、一元线性回归分析1.一元线性回归分析的特点1)两个变量不是对等关系,必须明确自变量和因变量。2)如果x和y两个变量无明显因果关系,则存在着两个回归方程:一个是以x为自变量,y为因变量建立的回归方程;另一

4、个是以y为自变量,x为因变量建立的回归方程。若绘出图形,则是两条斜率不同的回归直线。3)直线回归方程中,回归系数b可以是正值,也可以是负值。若0b>10,表示直线上升,说明两个变量同方向变动;若0b<,表示直线下降,说明两个变量是反方向变动。2.建立一元线性回归方程的条件任何一种数学模型的运用都是有前提条件的,配合一元线性回归方程应具备以下两个条件:1)两个变量之间必须存在高度相关的关系。两个变量之间只有存在着高度相关的关系,回归方程才有实际意义。2)两个变量之间确实呈现直线相关关系。两个变量之间只有存在直线相关关系,才能配合直线回归方程。3.建立一元线性回归方程的方法一元线性回归方程

5、是用于分析两个变量(一个因变量和一个自变量)线性关系的数学表达式,一般形式为:yc=a+bx式中:x代表自变量;yc代表因变量y的估计值(又称理论值);ab为回归方程参数。其中,a是直线在y轴上的截距,它表示当自变量x等于0时,因变量所达到的数值;b是直线的斜率,在回归方程中亦称为回归系数,它表示当自变量x每变动一个单位时,因变量y平均变动的数值。一元线性回归方程应根据最小二乘法原理建立,因为只有用最小二乘法原理建立的回归方程才可以同时满足两个条件:1)因变量的实际值与回归估计值的离差之和为零;2)因变量的实际值与回归估计值的离差平方和为最小值。只有满足这两个条件,建立的直线方程的误差

6、才能最小,其代表性才能最强。现在令要建立的一元线性回归方程的标准形式为yc=a+bx,依据最小二乘法原理,因变量实际值y与估计值yc的离差平方和为最小值,即Q=∑(y-yc)2取得最小值。为使Q=∑(y-yc)2=最小值根据微积分中求极值的原理,需分别对a,b求偏导数,并令其为0,经过整理,可得到如下方程组:∑y=an+b∑x∑xy=a∑x+b∑x2解此方程组,可求得a,b两个参数4.计算估计标准误差10回归方程只反映变量x和y之间大致的、平均的变化关系。因此,对每一个给定的x值,回归方程的估计值yc与因变量的实际观察值y之间总会有一定的离差,即估计标准误差。估计标准误差是因变量实际观

7、察值y与估计值yc离差平方和的平均数的平方根,它反映因变量实际值y与回归直线上各相应理论值yc之间离散程度的统计分析指标。估计标准误差:式中:sy——估计标准误差;y——因变量实际观察值;yc——因变量估计值;n-2——自由度如何描述两个变量之间线性相关关系的强弱?利用相关系数r来衡量当r>0时,表示x与y为正相关;当r<0时,表示x与y为负相关。5.残差分析与残差图:残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差在研

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。