南华大学公共卫生学院卫生学课件双变量直线回归与相关

南华大学公共卫生学院卫生学课件双变量直线回归与相关

ID:42739503

大小:420.00 KB

页数:56页

时间:2019-09-21

南华大学公共卫生学院卫生学课件双变量直线回归与相关_第1页
南华大学公共卫生学院卫生学课件双变量直线回归与相关_第2页
南华大学公共卫生学院卫生学课件双变量直线回归与相关_第3页
南华大学公共卫生学院卫生学课件双变量直线回归与相关_第4页
南华大学公共卫生学院卫生学课件双变量直线回归与相关_第5页
资源描述:

《南华大学公共卫生学院卫生学课件双变量直线回归与相关》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、双变量直线回归与相关(2学时)吴成秋 公共卫生学院预防医学系在大量的医学科研与实践中,经常会遇到对两个变量之间关系的研究,例如糖尿病人的血糖与其胰岛素水平的关系如何;某人群年龄的变化与其收缩压的关系怎样等;此时常用回归与相关分析。1.直线相关(简单相关):是研究事物或现象之间有无关系以及关系的方向和密切程度。2.直线回归(简单回归):是研究事物或现象之间的数量依存关系。设两个连续性变量分别为:xyx---为自变量。要求为随机正态变量或为精确控制的变量y—为依赖于x的变量,称作因变量(反应变量)。要求为随机正态变

2、量。若x为精确控制的变量,y为随机正态变量。只能作回归分析,即由x的大小来推算y的大小。若x与y均为随机正态变量。既可作相关分析,也可作回归分析。由x的大小来推算y的大小—Ⅰ型回归由y的大小来推算的x大小—Ⅱ型回归。一、直线回归的概念以某市汽车流量与大气中二氧化氮浓度的数据(见例12-1)在坐标纸上描点,得到图所示散点图。第一节直线回归汽车流量(辆/小时)NO2(mg/l)汽车流量(辆/小时)NO2(mg/l)13000.06615000.12014440.07614760.12916520.17018200.

3、13517560.15610600.02912000.040汽车流量与大气中二氧化氮浓度的关系图汽车流量与大气中二氧化氮浓度的关系设两个连续性变量分别为:xy汽车流量为自变量x,大气中二氧化氮浓度为因变量y。从图中可以看出,两个变量之间有一定的数量关系,但并非一一对应的函数关系。这种关系被称为回归关系。直线回归分析的主要任务是找出最合适的一条直线回归方程,以确定一条最接近各实测点的直线来描述两个变量之间的线性回归关系。设直线回归方程为:y=a+bxa为回归直线在y轴上的截距,其统计意义是当X取值为0时相应y的均

4、数估计值;a>0,交点在原点之上a<0,交点在原点之下a=0,交点在原点b称为回归系数,是直线的斜率,其统计意义是当x变化一个单位时y的平均改变的估计值(b个单位)。b>0时直线从左下方走向右上方,y随x的增大而增大;b<0时直线从左上方走向右下方,y随x的增大而减小;b=0时直线与x轴平行,y与X无直线关系。二直线回归方程的求法如果能够从样本数据中求得a、b的数值,回归方程即可唯一确定。从散点图中来看,求解a、b实际上就是怎样“合理地”找到一条能最好地代表数据点分布趋势的直线。将实测值y与假定回归线上的估计值

5、y的纵向距离(y-y),称为残差或剩余值各点残差要尽可能的小。由于考虑所有点之残差有正有负,所以通常取各点残差平方和最小的直线为所求,这就是所谓“最小二乘”原则。在一定假设条件下,如此得到的回归系数最为理想。按照这一原则,数学上可以容易地得到a、b的计算公式为:lxy,为x与y的离均差乘积和,简称离均差积和b=lxy=∑(x-x)(y-y)=∑xy-∑x∑y/nlxx∑(x-x)2∑x2-(∑x)2/na=y-bx可以在散点图上绘制出样本回归直线作为一种直观的统计描述补充形式,此直线必然通过点(X,

6、Y)且与纵坐标轴相交于截距a。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的X值代人回归方程得到一个点的坐标,连接此点与点(X,Y)也可绘出回归直线。1.绘制散点图2.计算基本数据x=13208,x2=19892352,y=0.921,y2=0.115075,xy=1445.164,x=1467,y=0.1023lxx=(x-x)2=x2-(x)2/n=19892352-132082/9=508878.223lyy=(y-y)2=y2-(y)2/n=0.

7、115075-0.9212/9=0.020826lxy=(x-x)(y-y)=xy-(x)(y)/n=1445.164-132080.921/9=93.5453.计算a、b的大小b=lxy/lxx=93.545/508878.223=0.0001838a=0.1023-0.00018381467.56=-0.16744.建立回归方程y=-0.1674+0.0001838x5.直线回归的图示法——回归线根据已求得的直线回归方程,可在自变量实测范围内远端取易于读数的X值代人回归方程得到一个点的坐标,

8、连接此点与点(X,Y)也可绘出回归直线三直线回归中的统计推断:即回归方程的假设检验建立样本直线回归方程,还必须回答它所来自总体的直线回归关系是否确实存在,即是否对总体有0?若无论X如何取值,y的总体均数y.x总在一条水平线上,即=0,总体直线回归方程并不成立,Y与X无直线关系。然而在一次随机抽样中,则会得到一个并不等于0的样本回归系数b。b与0相差到多大可以认为具有统计学意

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。