同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)

同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)

ID:42011606

大小:1.35 MB

页数:78页

时间:2019-09-06

同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)_第1页
同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)_第2页
同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)_第3页
同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)_第4页
同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)_第5页
资源描述:

《同济医学院-《医学多元统计》课件-双变量回归与相关(10硕)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、双变量回归与相关7/20/2021本章内容一、直线回归二、直线相关三、秩相关7/20/2021变量间关系问题年龄~身高、肺活量~体重、药物剂量与动物死亡率等两种关系依存关系:应变量Y随自变量X变化而变化———回归分析互依关系:应变量Y与自变量X间的彼此关系———相关分析回归分析与相关分析7/20/2021“回归”(regression)一词最早由英国统计学家F·Galton在一项有关父亲与儿子身高的研究中提出。以父亲的身高作为自变量(independentvariable),儿子的身高作为应变量(depen

2、dentvariable),将结果在平面直角坐标系上绘成散点图,发现其趋势近乎一条直线。无论是身材高还是身材矮的父亲所生儿子的身高都有向人群的平均身高“回归”的趋势,这就是“回归”的生物学内涵。第一节直线回归7/20/2021Galton数据散点图(英寸)7/20/2021例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)编号12345678年龄X131196810127尿肌酐含量Y3.543.013.09

3、2.482.563.363.182.65实例7/20/20217/20/2021回归的一般概念回归概念的提出表明我们可以用理想化的数学函数关系来解释应变量y与自变量x在数量变化方面的相互数量比例依存关系,因而可以用自变量x的变化来预测应变量y的取值,这是回归分析的数理逻辑基础。回归分析的目的用已知或易测或可测的变量对未知或难测或不可测变量的状态进行估计。一、直线回归的概念7/20/2021直线回归分析的核心任务是建立两个连续型变量间最优化的直线回归模型,从而采用x对y进行估计或预测。其统计模型可表述为:用样

4、本数据获得该数学模型的估计称为回归方程,即:直线回归的统计模型7/20/2021每个观测的y值都可以分解成三个部分:常量α(constant):即回归直线在纵坐标上的截距(intercept),它是y的本底水平,即x对y没有任何作用时,y的数量表现。回归部分βx:它刻画了应变量y的取值改变中,由y与自变量x的线性相关关系所引起的部分,即可以由x直接估计的部分。其中,x是自变量的取值。β称为回归系数(coefficientofregression),或回归直线的斜率(slope),β的数值的意义是指当自变量x

5、每改变一个度量单位时,因变量y的改变量的平均估计值。上述两部分之和用回归方程解释,就是yi在xi处的平均估计值,即为(a+bxi)回归估计误差εi(errorsofregressionestimation)线性回归模型的含义7/20/2021LINE假定xy等方差Equalvariance对于任何X值,随机变量Y的标准差Y

6、X相等独立Independence每一观察值之间彼此独立y

7、X=α+x线性Linearity反应变量均数与X间呈线性关系Y

8、X=α+X正态Normality对于任何给定的X,

9、Y均服从正态分布,均数为Y

10、X,标准差为Y

11、X二、直线回归模型的前提假设(LINE)7/20/2021最小二乘法原则(leastsquaremethod):使各实际散点(Y)到直线()的纵向距离的平方和最小。即使最小。三、回归参数的估计7/20/2021Yi(Y的估计值)=a+bXiYi估计值i残差i=Yi–估计值i寻找使S(残差i)2最小的直线最小二乘法图解7/20/2021因为直线一定经过“均数”点a和b的样本估计算法样本测量数据估计b的算法样本的截距a的计算公式7/20/2021例9-1某地方病研

12、究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。表9-18名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)编号12345678年龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65实例7/20/2021编号年龄X肌酐YX2Y2XY1133.5416912.5346.022113.011219.0633.11393.09819.5527.81462.48366.1514.88582.5

13、6646.5520.486103.3610011.2933.607123.1814410.1138.16872.65497.0218.55合计7623.8776472.27232.61SXSYSX2SY2SXY回归参数估计值a、b计算的实例7/20/2021斜率(b)当X每增加1个单位时,Y改变b个单位本例b=0.1392,表明在所研究的年龄范围内,年龄每增加1岁,尿肌酐含量增加0.1392mmol/24hY的截

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。