欢迎来到天天文库
浏览记录
ID:44237965
大小:2.43 MB
页数:54页
时间:2019-10-20
《简单回归分析-沈晓丽》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十章简单回归分析线性相关分析linearcorrelationanalysis回归(regression)和相关(correlation)分析:研究两个或多个变量间相互关系的统计方法。简单线性回归分析simplelinearregressionanalysis:研究两个变量间的数量依存关系的统计方法。:研究两个或多个变量之间关联性或关联程度的一种统计分析方法。1.是否有线性联系?2.正向的还是负向的?3.联系的程度?矮个子的父代:64英寸而它子代:67英寸1.父代的总均数=68英寸子代的总均数=69英寸2.高个子的父代:72英寸而它子代:71英寸
2、调查了1087对父子:1.1线性回归的概念高个子父子矮个子父子简单回归分析1.1线性回归的概念1.2线性回归模型的适用条件1.3回归参数的估计1.4总体回归系数β的统计推断1.5线性回归的应用线性回归(linearregression)又称简单回归(simpleregression):讨论两个变量间的数量依存关系的统计方法,即研究一个变量如何随另一个变量变化的常用方法。因变量dependentvariable反应变量responsevariable:非独立的、受其它变量影响的变量,常用“Y”表示。自变量independentvariable或预测因
3、子predictor或解释变量explanatoryvariable:能独立自由变化的变量,常用“X”表示。两个变量:例10-1:对14名40-60岁健康妇女的基础代谢(Y)与体重(X)的相关系数r=0.964,现问基础代谢(Y)是如何依存体重(X)变化而变化的?编号基础代谢(kj/d)体重(kg)编号基础代谢(kj/d)体重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.6
4、59.764970.662.8134874.462.175359.767.3145029.261.5表10-114名健康中年妇女的基础代谢与体重的测量值图10-114名健康中年妇女的基础代谢与体重的散点图由散点图看基础代谢与体重可能是直线关系μY∣X=α+βX上述直线方程称为线性回归模型linearregressionmodel可以假定固定基础代谢的总体均数μY∣X与体重X的关系可能是直线关系,即有:回归直线的截距参数(intercept),即X取0时,根据方程估算出的Y的平均水平。回归直线的斜率参数(slope),又称回归系数(regressio
5、ncoefficient),即X每增加一个单位,Y平均改变β个单位。通常情况下,研究者只能获得一定数量的样本数据,用样本数据建立的有关Y依从X变化的线性表达式称为回归方程(regressionequation),记为:称为Y的预测值;其意义为固定x时,Y的总体均数μY∣X的估计值。a与b分别为回归模型参数α和β的估计值。利用回归方程,只要给定一个40-60岁的健康妇女的体重值,就可估计出该体重个体的基础代谢值的平均值。以样本数据,可算出α和β的估计值a和b。后在直角坐标系以X为横坐标,Y为纵坐标作图,图形是一条直线,斜率为b,截距为a。线性回归关系
6、的特点:一个变量的取值不能由另一个变量唯一确定。当变量X取某个值时,变量Y取值可能有几个。各观测点分布在直线周围线性回归的分类:I型回归:因变量(Y)是随机变化的,但自变量(X)可以不随机,当它是能够精确测量和严密控制的量时,叫Y关于X的I型回归。II型回归:因变量(Y)和自变量(X)都是随机变化的,叫Y关于X的II型回归。表12-1不同IgG浓度下的沉淀环数据IgG浓度(IU/ml)X12345沉淀环直径(mm)Y4.05.56.27.78.5小结:回归分析(Regressionanalysis)从一组样本数据出发,确定变量之间的数学关系式;对这
7、些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出具有统计学意义的变量;利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。1.2线性回归模型的适用条件linenormal正态性equalvariance等方差性因变量Y的总体平均值与自变量X呈线性关系在一定范围内任意给定X值,则对应的随机变量Y服从正态分布在一定范围内,不同X值所对应的随机变量Y的方差相同linear线性independent独立性指任意两个观察值互相独立误差与残差称为随机误差(总体)称为残差(resi
8、dual)(样本)根据上述,直线回归分析要求资料满足固定X,则Y服从正态分布等价于残差服从正态分布。直线回归原理示意图:所
此文档下载收益归作者所有