第十二章 简单回归分析

第十二章 简单回归分析

ID:45160899

大小:783.00 KB

页数:44页

时间:2019-11-10

第十二章 简单回归分析_第1页
第十二章 简单回归分析_第2页
第十二章 简单回归分析_第3页
第十二章 简单回归分析_第4页
第十二章 简单回归分析_第5页
资源描述:

《第十二章 简单回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十二章简单回归分析宁夏医学院公共卫生学院流行病与卫生统计学教研室郭忠琴教授①了解回归的概念及种类;②了解回归分析的原理、几种常用回归的测定方法;③掌握直线回归的的应用条件与回归系数的意义④了解线性回归的应用。⑤了解非线性回归的计算与应用教学要求第十二章简单回归分析    前面介绍了两变量间关联性分析,本章与下一章我们将进一步的介绍观察数据中变量间的数量依存性的回归关系。第一节简单直线回归一、直线回归的概念及其统计描述反应变量(Y)与自变量(X)的简单线性模型(simplelinearregressionmodel)可表达为:在描述两变量的关

2、系时,一般把两个变量中能精确容易测量的作自变量,不易测量作为因变量。即用易测量的数据X估计不易测量的另一数据。如年龄估算小儿体重等。在描述体重与基础代谢率的依存关系中,将体重作为自变量(X),基础代谢率作为应变量(Y)。由图12-1可见,基础代谢率随体重增大而增大且呈直线趋势,但并非15点恰好全部都在一直线上。两变量数量间虽然存在一定关系,但不是十分确定的。这与两变量间严格对应的函数关系不同,称为直线回归(Linearregression)。直线回归是回归分析中最基本、最简单的一种,故又称简单simpleregression)。图12-114名

3、健康妇女的基础代谢率与体重的散点分布表12-1不同IgG浓度下的沉淀环直径测量值在实际应用中,线性回归的自变量和应变量的要求?IgG(IU/ml)浓度X12345沉淀环直径(mm)Y4.05.56.27.78.5图12-2IgG浓度与沉淀环直径的散点分布二、回归模型的前提假设  线性回归模型的前提条件是:线性(linear)、独立(independent),正态(normal),等方差(equalvariance) 1、线性是指反应变量Y的总体平均值与自变量X呈线性关系。2、独立是指任意两观察值互相独立。3、正态性假定是指线性模型的误差项i服

4、从正态分布。4、等方差是指在自变量X取值范围内,不论X取什么值,Y都具有相同的方差。三、回归参数的估计一)回归参数估计的最小二乘原则参数与一般只能通过样本数据来估计。当X取值为Xi时,Y的平均值的估计应为a+bXi,而实际观察值为Yi。两者之差称为残差(residual),即当a与b取不同值时获取不同的候选直线,如能求a与b的适宜值,能使所有实测值到这条直线的上纵向距离的平方和为最小,则称这一对a和b为与的最小二乘估计(leastestimation,LES)。二)回归参数的估计方法a为Y轴上的截距;b为斜率,表示X每改变一个单位,Y的

5、变化的值,称为回归系数;表示在X值处Y的总体均数估计值。为求a和b两系数,根据数学上的最小二乘法原理,可导出a和b的算式如下:1.由原始数据及散点图的初步分析,本例呈直线趋势,故作下列计算。2.求3.求回归系数b和截距a。4.列出回归方程三)、直线回归方程的图示为了进行直观分析或实际需要,可按回归方程在坐标纸上作图。在自变量X的实测全距范围内任取相距较远且易读的两X值,代入回归方程,如上例取在图上确定(37.1,3385.47)和(67.3,5240.36)两点,用直线连接,即得直线方程的图形。图12-114名健康妇女的基础代谢率与体重的散点分

6、布四、回归系数的统计推断前面所求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作是否为零的假设检验,用方差分析或t检验。一)、方差分析三、直线回归中的统计推断一)回归方程的假设检验1、方差分析前面所求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作是否为零的假设检验,用方差分析或t检验。在讲述假设检验之前,我们先

7、对就应变量Y的离均差平方和lYY作一分析。lYY的分析如图9-4,p点的纵坐标被回归直线与均数截成三个线段:图9-4平方和划分示意图它们各自的自由度分别为: 可计算统计量F:方差分析分析表SS回它反应在Y的总变异中由于X与Y的直线关系而使Y变异减少的部分.它越大说明回归效果越好. SS剩它反应X对Y的线性影响之外的一切因素对Y的变异的作用.它越小,说明直线回归的估计误差越小.变异来源SSMSF总变异n-1回归变异1剩余变异n-2变异来源SSMSFP总变异4645447.0113回归变异4318227.7214318227.22158.36<

8、0.01剩余变异327219.301227268.27表12-2例12-1的方差分析表二)总体回归系数的假设检验例12-2检验例12-1求体重与基础

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。