欢迎来到天天文库
浏览记录
ID:1500639
大小:1.02 MB
页数:74页
时间:2017-11-12
《第十一章 简单回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十一章简单回归分析1Regression释意F.Galton2outline简单线性回归回归模型的建立回归系数的假设检验和区间估计线性回归的应用估计置信区间估计预测区间残差分析34561概述Y因变量(dependentvariable,responsevariable)X自变量(independentvariable)简单回归的形式:简单回归是回归分析中最基本、最简单的一种,又称直线回归。7(1)a为回归直线在Y轴上的截距。a>0,表示直线与纵轴的交点在原点的上方;a<0,则交点在原点的下方;a=0,则回归直线通过原点。8(2)b为回归系数,即直线的斜率。b>0,直线从左下方走向
2、右上方,Y随X增大而增大;b<0,直线从左上方走向右下方,Y随X增大而减小;b=0,表示直线与X轴平行,X与Y无直线关系。b的统计学意义是:X每增加(减)一个单位,Y平均改变b个单位。92回归模型的前提假设线性(linear)独立(independent)正态(normal)等方差(equalvariance)恰好为“LINE”。10给定X时,Y是正态分布、等方差示意图xy11给定X时,Y是正态分布、不等方差示意图xy12最小二乘法(leastsquareestimation,LSE)基本思想:使各实测值Y与回归直线上对应的估计值之差的平方和为最小,在这个准则下,可导出a、b的最小
3、二乘估计如下:3估计回归参数,建立回归模型13自变量反应变量14①先作散点图,以判断两变量间是否呈线性趋势15凝血酶浓度(X)与凝血时间(Y)数据16回归系数b:②求直线回归方程截距a:17由凝血酶浓度x估计凝血时间y18③绘制回归直线计算不太接近的两点的Y值:X=1.1单位/毫升时Y=21.77393-6.9802×1.1=14.0957(s)X=0.6单位/毫升时Y=21.77393-6.9802×0.6=17.5858(s)19③绘制回归直线图12-3凝血酶浓度(X)与凝血时间(Y)的散点分布及拟合直线204回归方程的意义及性质1)b的意义:2)a的意义:21b的意义回归系数
4、b称为斜率(slope),表示自变量增加一个单位时,应变量平均改变的量。凝血酶浓度每增加1单位/ml,则凝血时间平均减少6.9802秒b的单位为(Y的单位/X的单位)回归与相关均表示两变量间的线性关系,故回归系数b与相关系数r的正负号是相同的。22a的意义a截距或常数项(intercept,constant)X=0时,Y的估计值a的单位与Y值相同23估计值的意义给定X时,Y的平均值。X=1.1时,=14.0957,即凝血酶浓度为1.1单位/ml的健康成人中,估计其平均凝血时间为14.0957秒。X=0.6时,=17.5858,即凝血酶浓度为0.6单位/ml的健康成人中,估计其平均凝
5、血时间为17.5858秒24的意义为残差:点到直线的纵向距离。各点残差要求尽可能小.25回归直线的有关性质直线通过均点直线上方各点到直线的纵向距离之和=直线下方各点到直线的纵向距离之和即:各点到该回归线纵向距离平方和较到其它任何直线者为小。即最小26残差平方和或剩余平方和(residualsumofsquares)。综合表示点距直线的距离。在所有的直线中,回归直线的残差平方和是最小的。(最小二乘)的意义275总体回归系数β的统计推断区间估计假设检验28总体回归系数β的置信区间2930①样本回归系数b的标准误:sy,x为的剩余标准差(或回归的剩余标准差):X的离均差平方和为:31总体
6、回归系数β的置信区间32②总体回归系数β的假设检验建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在,即是否对总体有?3334如图,无论X如何取值,总在一条水平线上,即0b=,总体直线回归方程并不成立,意即Y与X无直线关系。然而在一次随机抽样中,如果所得样本为实心园点所示,则会得到一个并不等于0的样本回归系数b。b与0相差到多大可以认为具有统计学意义?可用方差分析或与其等价的t检验来回答这一问题。Y35样本回归系数b总体回归系数H0:总体回归系数为0,=0,即两指标间无直线回归关系;H1:总体回归系数不为0,
7、0;即两指标间有直线回归关系;=0.05。36回归系数的方差分析376因变量总变异的分解XP(X,Y)Y38Y的总变异分解总变异SS总回归平方和SS回剩余平方和SS剩396因变量总变异的分解XP(X,Y)Y40Y的总变异分解41方差分析表变异来源SSvMSF回归SS回1SS回/1MS回/MS剩剩余SS剩n-2SS剩/n-2总变异SS总n-142回归方程的假设检验---方差分析H0:两指标间无直线回归关系;H1:两指标间有直线回归关系。=0.05。lXX,lYY,
此文档下载收益归作者所有