统计-相关与回归分析

统计-相关与回归分析

ID:42321395

大小:1.68 MB

页数:91页

时间:2019-09-12

统计-相关与回归分析_第1页
统计-相关与回归分析_第2页
统计-相关与回归分析_第3页
统计-相关与回归分析_第4页
统计-相关与回归分析_第5页
资源描述:

《统计-相关与回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回归分析适合研究哪类问题?回归方程的显著性检验适合什么情况?回归系数的显著性检验适合什么情况?回归分析:广义上的回归分析,同时包括狭义的相关分析与回归分析的全部内容,亦即本章既研究现象间相互依存关系的密切程度,又研究现象之间数量相关的具体形式。重点:明确相关关系,函数关系,因果关系,掌握基本的回归分析方法,能应用实际资料构建一元线性回归模型。难点:多元线性回归分析。7.1回归分析的基本概念7.1.1因变量(Y)与自变量(X)之间的关系根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系统计关系7.1.1因变量(Y)与自变量(X)之间的关

2、系1.函数关系即对两个变量X,Y来说,当X值确定后,Y值按照一定的规律唯一确定,即形成一种精确的关系。(1)欧姆定律:I=U/R;(2)气体体积、压强与绝对温度的关系:PV=RT;(3)速度与距离、时间的关系:v=s/t。7.1.1因变量(Y)与自变量(X)之间的关系2.统计关系即当X值确定后,Y值不是唯一确定的,但大量统计资料表明,这些变量之间还是存在着某种客观的联系。例如:图7.1在直角坐标平面上,标出了10个观测点的坐标位置,他们表示以家庭为单位,某种商品年需求量与该商品价格之间的10对调查数据。7.1.2回归分析图7-17.1.2回归分

3、析例如,炼钢厂在冶炼当中,成品含碳量和冶炼时间这两个变量之间,就不存在确定性的关系,对于含碳量相同的钢,冶炼时间却不相同.再如,人的年龄与血压之间,要找出一个确定性的关系也是很困难的.然而,这些变量之间还是有着密切的关系的,虽然各组数据不是准确地服从f(x)关系,但y值总还是随着x值的增加而变化.这种关系称为统计关系.变量与变量的关系:确定性关系函数关系U=IRv=gt……变量与变量的关系:非确定性关系统计相关(具有统计规律)Y=f(x1,x2,…,xn)+ε回归分析方法7.1.2回归分析研究因素(自变量)的多少,一元回归分析多元回归分析;以其

4、变量之间呈线性或非线性的关系又可分为线性回归分析非线性回归分析。7.1.2回归分析回归分析主要解决以下几个方面的问题:(1)确定几个特定的变量之间是否存在相关关系,如果存在的话,找出它们之间的数学表达式;(2)根据一个或几个变量(试验因素)的值,预测或控制另外几个变量(试验因素)的取值,并给出其精确度;(3)对共同影响一个变量的多个因素,找出其中主要影响因素、次要影响因素,并判定这些因素之间的相关程度。7.1.2回归分析回归分析(RegressionAnalysis)就是应用统计方法,对大量的观测数据进行整理、分析和研究,从而得出反映事物内部规

5、律性的一些结论。7.2一元线性回归模型7.2.1统计关系的特征统计关系特征观测点散布在统计关系直线的周围,此种情况说明Y的变化除了受自变量X影响以外,还受其他因素的影响。因此试图建立这样一个回归模型,通过对此模型所作的一些假设,可以体现出上述统计关系所刻划的特征。因变量Y随自变量X有规律的变化,而统计关系直线描述了这一变化的趋势。7.2.2一元线性回归模型假设根据统计关系特征,可以进行下述假设:假设(2)这些Y的概率分布的均值,有规律的随X变化而变化(1)对于自变量的每一水平X,存在着Y的一个概率分布;7.2.3一元线性回归模型Y与X具有统计关

6、系而且是线性建立回归模型Yi=β0+β1Xi+εi(i=1,2,···,n)其中,(Xi,Yi)表示(X,Y)的第i个观测值,β0,β1为参数,β0+β1Xi为反映统计关系直线的分量,εi为反映在统计关系直线周围散布的随机误差εi~N(0,σ2)。对于误差项,在回归分析中有如下假设:1)误差项是随机变量,它的期望值为0。2)对于所有的x值,误差项的方差为常数。3)误差项之间相互独立,即与一个值相联系的误差对与另一个值相联系的误差没有影响。4)随机误差项服从正态分布。7.2.4一元线性回归方程描述y的均值E(y)与x的关系的方程叫做回归方程。不难

7、看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即截距斜率期望值7.2.5估计一元线性回归方程在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。分别为的估计值,是样本回归直线的截距和斜率。实际观测到的因变量y值,并不完全等于估计值,如果用e表示二者之差,则样本回归模型为:截距斜率:第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。第二,总体回归模型中的β0和β1是未知的参数,表

8、现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。