线性相关和回归(一)

线性相关和回归(一)

ID:33181395

大小:150.00 KB

页数:14页

时间:2019-02-21

线性相关和回归(一)_第1页
线性相关和回归(一)_第2页
线性相关和回归(一)_第3页
线性相关和回归(一)_第4页
线性相关和回归(一)_第5页
资源描述:

《线性相关和回归(一)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蚁羅芄蚅薇羄莇蒇袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肃芇蝿聿膅蒂螅肈莇芅蚁肈肇薁薇肇腿莃袅肆节蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀芈薅袈蝿肈蒈螄螈膀蚄蚀螇芃蒇薆螆莅艿袄螆肄蒅螀袅膇芈蚆袄艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀虿袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蚁羅芄蚅薇羄莇蒇袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肃芇蝿聿膅蒂螅肈莇芅蚁肈肇薁薇肇腿莃袅肆节蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀芈薅袈蝿肈蒈螄螈膀蚄蚀螇芃蒇薆螆莅艿袄螆肄蒅螀袅膇芈蚆袄艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀虿袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蚁羅芄蚅薇羄莇蒇

2、袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肃芇蝿聿膅蒂螅肈莇芅蚁肈肇薁薇肇腿莃袅肆节蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀芈薅袈蝿肈蒈螄螈膀蚄蚀螇芃蒇薆螆莅艿袄螆肄蒅螀袅膇芈蚆袄艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀虿袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蚁羅芄蚅薇羄莇蒇袆羄肆芀螂羃膈蒆蚈羂芁第九章线性回归上一章讨论的线性相关用于描述两个随机变量X与Y之间线性联系的程度,结论所反映的是它们相互之间的关系,两变量并无主次之分。随着所探索问题的深入,研究者通常更感兴趣于其中的一个变量如何定量地影响另一变量的取值,如医学研究中常需要从某项指标估算另一项指标,如果这指标分别是测

3、量变量X和Y,我们希望由X推算Y的值。我们称X为自变量,Y则称为依赖于X的因变量。如果Y与X的关系呈线性时,我们可以用线性回归(linearregression)描述两者的关系。一.回归的概念:100多年前,有位英国遗传学家(Galton)注意到当父亲身高很高时,他的儿子的身高一般不会比父亲身高更高。同样如果父亲很矮,他的儿子也一般不会比父亲矮,而会向一般人的均值靠拢。当时这位英国遗传学家将这现象称为回归,现在将这概念引伸到随机变量有向回归线集中的趋势。即观察值不是全落在回归线上,而是散布在回归线周围。但离回归线越近,观察值越多,偏离较远的观察值极少,这

4、种不完全呈函数关系,但又有一定数量的关系的现象称回归。二.线性回归的统计描述:(一)线性回归的方程:=a+bX(二)线性回归的参数估计:线性方程:Y=a+bX回归方程:=a+bX式中a,b是决定回归直线的两个系数。a为截距,b为回归系数,即直线的斜率。b的统计学意义是X每增加(减)一个单位,Y平均改变b个单位。怎样的最好地代表了所有的Y,需要有个标准。经典的标准是最小二乘(leastsquares)原则:每个观察点距离回归线的纵向距离的平方和最小。得:用例8.1,示范线性回归的计算过程:=74.17+0.5698X三.回归系数的统计推断:(一)回归系数的

5、假设检验(t检验):1.建立检验假设:H0:β=0,H1:β≠0,α=0.052.计算统计量t:υ=n-2先计算剩余标准差s:已知:b=0.5698s为剩余标准差:即去除X对Y的作用后,Y的变异。回归系数的标准误为:()3.确定概率和判断结果:υ=n-2=20-2=18,P<0.01,拒绝H0,可认为回归系数有统计学意义。(二)回归方程的假设检验(方差分析,ANOVA):1.建立检验假设:H0:回归无贡献H1:回归有贡献α=0.052.计算统计量F:方差分析的基本思想:将总的变异分离成各个部分,确定各部分变异的来源,然后将处理因素的变异与随机变异(误差)

6、比较。如果比值接近1,说明都是随机变异,如果比值远大于1,说明处理变异中除随机变异外还有效应变异存在。在Y的总变异(总离均差平方和)中,包含回归离均差平方和和残差离均差平方和。即:SST=SSr+SSe总SST是:回归SSr是:残差SSe是:698.55-603.63=94.92方差分析的统计量是F值:变异来源离均差平方和(SS)自由度(υ)均方(MS)F值回归603.631603.63114.54残差94.92185.27总698.55193.确定概率和判断结果:查υ1=1和υ2=18的F界值(附表6.1),得F=4.41,P<0.05,可以认为回归有

7、贡献。(★分子的自由度为1时,)(三)确定系数:相关系数的平方称为确定系数,它反映回归贡献的程度。相当于在总离均差平方和中回归能解释的百分比。即说明回归贡献占Y的总变异中的比例。本例r=0.9296,R2=0.8641,即由父亲的身高信息大约可解释儿子身高变异性的86%。四.几种置信区间估计:1.β的置信区间:意义:估计X对Y的效应有多大,如例9.1:回归系数为0.5698,置信区间是(0.48,0.68),说明儿子身高起码有一半是受父亲影响的。2.的置信区间:意义:当估计出Y的值(),根据置信区间可以知道误差有多大。如例9.1:某父亲身高165.8cm

8、,估计他儿子的身高是168.64cm,置信区间是167.51~169.77cm,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。