《授课reg》PPT课件

《授课reg》PPT课件

ID:39526036

大小:1.04 MB

页数:69页

时间:2019-07-05

《授课reg》PPT课件_第1页
《授课reg》PPT课件_第2页
《授课reg》PPT课件_第3页
《授课reg》PPT课件_第4页
《授课reg》PPT课件_第5页
资源描述:

《《授课reg》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回归分析(Regression)南京中医药大学李国春基本统计学理论回归分析的概念常见的回归分析介绍SPSS操作直线回归多元线性回归曲线拟合讲课目录2回归的概念回归分析是研究变量间数量上的非确定性的依存关系,并能用适当的函数形式表示出来,从而能用一个或多个变量来推测另一变量的估计值及波动范围的统计方法。如果因变量Y与自变量(或称解释变量)X呈直线关系时,称直线回归。直线回归要求Y服从正态分布且方差相等。多元回归分析用以研究一个因变量与多个自变量之间线性依存基本统计学原理3关系。当变量间不是线性关系时

2、,通常需进行数据转换以满足所需条件,再进行线性回归。当然,有时也直接用原始数据进行非线性的回归分析。根据资料类型,常见的回归分析总结如下:基本统计学原理456儿科大夫在给小患者开药时依据回归方程:Y(体重Kg)=2*X(年龄周岁)+8对体重进行估计,从而省去了测量体重的麻烦。举例:7常见回归分析方法介绍Ⅰ、直线回归㈠直线回归方程的建立因变量Y与自变量X的直线回归方程的一般表达为:Y=a+bX式中的a、b是决定自变量的两个系数。a为回归直线在Y轴上的截距(intercept)。b为回归系数(regr

3、essioncoefficient),即直线斜率,反映了自变量X变化一个单位时,因变量Y的平均变化量。根据最小2乘原理,求a、b使得∑(Y-Y)2达到最小,∧8则:∑(X—X)(Y—Y)Lxyb==∑(X—X)2Lxxa=Y—bX910例1:某地一年级12名女大学生的体重与肺活量的数据如下,试求肺活量(L)Y对体重(kg)X的直线回归方程。直线回归方程建立的步骤11⒈按各组x、y实测值绘制散点图,观察是否存在线性趋势。122、求直线回归方程。∑(X—X)(Y—Y)Lxyb==∑(X—X)2Lxxa

4、=Y—bX13Y=0.000413+0.05883X∧16(二)直线回归方程的假设检验1、因变量离均差平方和的分解因变量的离均差(Y—Y)可分解为两部分:∧∧(Y—Y)=(Y—Y)+(Y—Y)上式右边的第一项与X有关,第二项称为残差或剩余。可以证明:∧∧∑(Y—Y)2=∑(Y—Y)2+∑(Y—Y)2因变量离均差平方和=回归平方和+剩余平方和SS总=SSR回归+SSE剩余17(Y—Y)(Y—Y)∧∧(Y—Y)Y18SS总=∑(Y-Y)2,为回归平方和,它反映在Y的总变异中由于X与Y的直线关系而使Y变

5、异减小的部分,也就是在总平方和中可以用X解释的部分。SSR越大,说明回归效果越好。SSE=∑(Y-Y)2,为剩余平方和,它反映X对Y的线性影响之外的一切因素对Y的变异的作用,也就是在总平方和中无法用X解释的部分。在散点图中,各测点离回归直线越近,SSE也就越小,说明直线回归的估计误差越小。19另外,还可以用决定系数(coefficientofdetermination,记作R2)来表示两变量间回归关系的强度。决定系数的决定公式为R2=SSR/SST=回归平方和/总平方和可见R2越大,回归效果越好。

6、在一般线性回归分析中,还将R2按模型中包含的参数个数进行校正,称为校正R2(记作R2Adj),其计算公式为R2Adj=1—(1—R2)(n—1)/(n—k—1)式中:k是模型中的参数个数(不包含截距),直线回归中k=1。202、方差分析法根据离均差平方和的分解,计算检验统计量F值为SSR/γRMSRF==SSE/γEMSEγR=1γE=n-2依据F值作出推断。21223、回归系数的t检验。对总体回归系数为零的假设也可采用t检验,t值按下式计算:b-0bt==SbSY.X/√Lxxv=n-2∑(Y-

7、Y)2MSESY.X==n-2n-223式中:Sb为样本回归系数的标准误;SY.X为剩余标准差,表示扣除自变量X影响后因变量Y的变异程度。求得t值后,确定P值,γ=n-2。对直线回归来说,模型的F检验与回归系数的t检验的等价的,即t=√F。24(三)直线回归的区间估计1、因变量期望值(均数)μY的估计。μY是总体中当X为某定值时Y的均数。Y是其估计值,SY表示其抽样误差的标准误,按下式计算:1(X-X)2SY=SY.X+n∑(X-X)226μY的(1-α)可信区间为:(Y-tα(n-2)SY,Y-

8、tα(n-2)SY)缩写为Y±tα(n-2)SY2、因变量个体值Y的容许区间。即总体中当X为某定值时Y的波动范围。可用于估计因变量的参考值范围,其标准差SY按下式计算:1(X-X)2SY=SY.X1++n∑(X-X)227Y的1-α容许区间为:(Y-tα(n-2)SY,Y-tα(n-2)SY)缩写为Y±tα(n-2)SY28Ⅱ、多元线性直线回归例:10名中学生的体重(x1,kg),胸围(x2,cm),胸围的呼吸差(x2,cm)及肺活量(y或x4,ml)的资料如下表所示。现要求作应变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。