第六讲 双变量回归与相关ppt课件.ppt

第六讲 双变量回归与相关ppt课件.ppt

ID:58677088

大小:974.50 KB

页数:115页

时间:2020-10-05

第六讲  双变量回归与相关ppt课件.ppt_第1页
第六讲  双变量回归与相关ppt课件.ppt_第2页
第六讲  双变量回归与相关ppt课件.ppt_第3页
第六讲  双变量回归与相关ppt课件.ppt_第4页
第六讲  双变量回归与相关ppt课件.ppt_第5页
资源描述:

《第六讲 双变量回归与相关ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第九章双变量回归与相关双变量:应变量也称反应变量,用Y表示自变量也称解释变量,用X表示3回归分析:应变量Y(dependentvariable)与自变量X(independentvariable)在数量上的依存关系,X的值固定时可以估计出Y的平均水平。相关分析:不要求由自变量去估计应变量,仅仅研究两变量间有无相关关系,且相关的方向和程度如何。4第一节直线回归5问题的提出在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液临床上不容易采集到。有研究表明血清中IL-6

2、含量与脑脊液IL-6有关,但是两者的数量依存关系不详。所以要想利用容易测出的血清中IL-6含量去估计急性脑血管病病人脑脊液IL-6水平,就须求得脑脊液IL-6与血清IL-6的依存关系。6SAH患者血清和脑脊液IL-6(pg/ml)检测结果现随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据见表如下:7血清IL-6(pg/ml)10080604020脑脊液IL-6(pg/ml)22020018016014012010080608研究两个连续变量之

3、间的数量依存关系(Y随着X变化而变化),找出一条最能代表这种类型数据的直线方程,就是直线回归要解决的问题。一、直线回归的概念9不同于数学上的X和Y的一一对应函数关系。研究X和Y的均数的关系,属于统计学上的回归关系,其求出来的直线方程叫直线回归方程,不是严格的数学方程。二、直线回归的特点三、总体线性回归模型:截距(intercept)β:斜率(slope),又称总体回归系数(regressioncoefficient):X取每个值时,相应的Y的总体均数11β:X每增加(减少)一个单位,Y的平均水平改变β个单位。:是回归直

4、线在Y轴上的截距,其统计学意义是当X为0时,方程所估计值Y的平均水平。注意:解释一定要有实际专业意义,否则不予解释。12样本直线回归方程:为X取某定值时的一个点估计值。为来自的一个样本131.a为回归直线在Y轴上的截距a>0,表示直线与纵轴的交点在原点的上方;a<0,则交点在原点的下方;a=0,则回归直线通过原点。a=0a<0a>0XY14b>0,直线从左下方走向右上方,Y随X增大而增大;b<0,直线从左上方走向右下方,Y随X增大而减小;b=0,表示直线与X轴平行,X与Y无直线关系。XY2.b为样本回归系数,即直线的斜

5、率b的统计学意义是:X每增加(减)一个单位,Y平均改变b个单位。b>0b<0b=015四、回归方程的估计原则:最小二乘法(leastsumofsquares),即可保证各实测点至回归直线的纵向距离的平方和(残差平方和)最小。求解a、b实际上就是“合理地”找到一条能最好代表数据点分布趋势的直线。16残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离。1718例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表。估计尿肌酐含量(Y)对其年龄(X)的回归方程。19表9-18名

6、正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)20解题步骤222324此直线必然通过点(,)且与纵坐标轴相交于截距a。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的X值代入回归方程得到一个点的坐标,连接此点与点(,)也可绘出回归直线。2526五、直线回归中的统计推断直线回归的统计推断包括:总体回归系数的可信区间估计总体回归方程是否成立的假设检验27(一)回归方程的假设检验建立样本直线回归方程,只是对样本中两变量间关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在281、方

7、差分析29(X,Y)3031上式用符号表示为式中3233上述三个平方和,各有其相应的自由度,并有如下的关系:35如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F36式中372、t检验38例9-2检验例9-1数据得到的直线回归方程是否成立?39(1)方差分析40表9-2方差分析表41(2)t检验42注意:43(二)总体回归系数的可信区间估计利用上述对回归系数的t检验,可以得到β的1-α双侧可信区间为44例9-3根据例9-1中所得b=0.1392,估计其总体回

8、归系数的双侧95%可信区间。45(0.1392-2.447×0.0304,0.1392+2.447×0.0304)=(0.0648,0.2136)46六、简单线性回归的应用:(一)利用回归方程进行预测预报47当X0=时,达到最小值,X0离越远,其标准误越大,区间越宽,所以在直角坐标系中表示为一条中间窄,两端宽的带,最窄处对应于X0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。