欢迎来到天天文库
浏览记录
ID:42999728
大小:987.00 KB
页数:34页
时间:2019-09-27
《简单的回归分析卫生统计学考研课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十二章简单回归分析 前面介绍了两变量间关联性分析,本章与下一章我们将进一步的介绍观察数据中变量间的数量依存性的回归关系。第一节简单直线回归一、直线回归的概念及其统计描述在上一章中,对15名健康人凝血浓度(Y)与凝血时间(X)数据计算相关系数,定量描述了变量间关联性的强弱程度与方向。为直观地说明直线回归的概念,我们以以上一章中对15名健康人凝血浓度与凝血时间数据为例,来探讨两变量间依存变化关系。反应变量(Y)与自变量(X)的简单线性模型(simplelinearregressionmodel)可表达
2、为:表12-115名健康成人凝血时间与凝血酶浓度测量值在通常情况下,研究者只能获取一定数量的样本数据,用该样本数据建立的有关Y与X变化的线性方程称为回归方程(regressionequation)即:受试者号123456789101112131415X1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7Y141315151314161714161516141517在描述两变量的关系时,一般把两个变量中能精确容易测量的作自变量,不易测量作为因变量。即用易测量的数据X估
3、计不易测量的另一数据。如年龄估算小儿体重等。在描述凝血时间与凝血浓度的依存关系中,将凝血酶浓度作为自变量(X),凝血时间作为应变量(Y)。由图12-1可见,凝血时间随凝血酶浓度增大而减少且呈直线趋势,但并非15点恰好全部都在一直线上。两变量数量间虽然存在一定关系,但不是十分确定的。这与两变量间严格对应的函数关系不同,称为直线回归(Linearregression)。直线回归是回归分析中最基本、最简单的一种,故又称简单simpleregression)。图 12-1 凝血浓度与凝血时间的散点分布二、回归模
4、型的前提假设 线性回归模型的前提条件是:线性(linear)、独立(independent),正态(normal),等方差(equalvariance)1、线性是指反应变量Y的总体平均值与自变量X呈线性关系。2、独立是指任意两观察值互相独立。3、正态性假定是指线性模型的误差项i服从正态分布。4、等方差是指在自变量X取值范围内,不论X取什么值,Y都具有相同的方差。三、回归参数的估计一)回归参数估计的最小二乘原则参数与一般只能通过样本数据来估计。当X取值为Xi时,Y的平均值的估计应为a+bXi
5、,而实际观察值为Yi。两者之差称为残差(residual),即当a与b取不同值时获取不同的候选直线,如能求a与b的适宜值,能使所有实测值到这条直线的上纵向距离的平方和为最小,则称这一对a和b为与的最小二乘估计(leastestimation,LES)。二)回归参数的估计方法a为Y轴上的截距;b为斜率,表示X每改变一个单位,Y的变化的值,称为回归系数;表示在X值处Y的总体均数估计值。为求a和b两系数,根据数学上的最小二乘法原理,可导出a和b的算式如下:1.由原始数据及散点图的初步分析,本例呈直线趋势,
6、故作下列计算。2.求3.计算X、Y的均数,及离均差平方和lXY、lyy与离均差积和lXY。4.求回归系数b和截距a。5.列出回归方程三)、直线回归方程的图示为了进行直观分析或实际需要,可按回归方程在坐标纸上作图。在自变量X的实测全距范围内任取相距较远且易读的两X值,代入回归方程,如上例取在图上确定(0.6,17.58581)和(1.1,14.09373)两点,用直线连接,即得直线方程的图形。图 12-3 凝血浓度与凝血时间的散点分布及拟合直线四、回归系数的统计推断前面所求得的回归方程是否成立,即X、Y是
7、否有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作是否为零的假设检验,用方差分析或t检验。一)、样本回归系数b的抽样误差本章例12-1,二)总体回归系数的假设检验例12-2检验例12-1求凝血时间对凝血酶浓度的直线关系是否成立?1.假设2.检验统计量三)回归系数的区间估计例12-3试用例12-11所计算的样本回归系数b=-0.6902,估计总体回归系数的95%的可信区间:Sb=0.76,第二节 线性回归的应用一、
8、总体回归线的95%置信带是总体中当X为某一定值X0的条件下Y的均数。它的点估计为 ,其标准误为它的(1-)置信区间为例12-1试计算当X0=1.1时,的95%可信区间。用同样方式,可计算出所有15个观测点的总体均数的95%置信区间。二、个体Y值的容许区间总体中,X为某定值时,个体Y值的波动范围,其标准差SY(请勿与样本标准差相混)它为:例12-5用例12-1所求回归方程,试计算当X0=1.1时,个体Y值的95%容许区间。
此文档下载收益归作者所有