欢迎来到天天文库
浏览记录
ID:56530525
大小:422.00 KB
页数:59页
时间:2020-06-27
《杨永利多重线性回归与相关.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十三章多重线性回归分析Multiplelinearregressionanalysis生物医学研究领域中的多因素相互作用现象非常普遍。如身高不仅受到遗传因素的影响,而且还受到营养状况、体育锻炼情况、居住环境因素的作用。血压的高低除了与年龄有关外,还与家族史、饮食习惯、劳动强度等因素有关。本章介绍如何采用多重线性回归分析定量刻画多个因素对结果指标(如身高、血压)的影响。教学内容一、多重线性回归模型拟合实例二、多重线性回归模型的模型假设诊断三、多重线性回归模型的应用及注意事项教学目的和要求①熟悉多重线性
2、回归分析在医学中的应用;②掌握多重回归分析的基本步骤、模型假设、并能对SPSS输出结果进行解释。一、多重线性回归模型拟合实例【典型案例】例17-5为了研究影响肥胖者瘦素的主要危险因素,某研究者调查了某医院肥胖门诊的500名肥胖就诊者的瘦素、年龄、体重指数等因素,为了简化问题,仅取自变量为年龄(X1,岁)、体重指数(X2,kg/m2)、总胆固醇(X3,mmol/L)、是否患糖尿病(X4,患糖尿病为1,不患糖尿病为0)和是否患高血压(X5,患高血压为1,不患高血压为0),应变量为瘦素(Y,ng/ml)。为了
3、说明的方便,这里仅从500名肥胖就诊者中随机取30例,具体数据如表17-11所示,分析肥胖者瘦素的主要影响因素。【案例分析】研究目的:了解年龄、体重指数、总胆固醇、是否患糖尿病和是否患高血压与瘦素的依存关系,即多个自变量与一个因变量的关系;资料分析方法:多重回归分析。多重线性回归分析是简单线性回归分析的推广,它研究的是一组自变量如何直接影响一个因变量。这里自变量指的是能独立自由变化的变量,一般用表示X;因变量指的是非独立的、受其它变量影响的变量,一般用Y表示。一、概念单因单果---简单线性回归和相关分析
4、多因单果---多重线性回归与相关分析多因多果---典型相关分析;多元回归分析;路径分析,验证性因子分析变量之间的关系二、多重线性回归分析的基本原理最小二乘法(leastsquareestimate,LSE)多重线性回归分析的基本原理就是利用观察或收集到的因变量和自变量的一组数据建立一个因变量关于自变量的线性函数模型,并且这个模型最好地拟合了观察数据。所谓最好地拟合了观察数据,从几何意义上讲,就是从各种可能的因变量关于自变量的线性函数中找出一个最优的模型,使得这个最优模型对应的空间中几何体尽可能地靠近所有
5、的观察值对应的几何点。图13-1两个自变量时,回归平面示意图例如,收集n个样本在指标变量Y,X1和X2上的观察值,拟合一个Y关于X1和X2的二元线性回归模型。因为这个模型是三维空间中的一个平面,因此,二元线性回归分析的几何意义就是要从三维空间里所有的平面中找出一个最优平面,使得这个最优平面最大限度地靠近n组观测值对应的三维空间中的n个点(X1,X2,Y)。多重线性回归分析是借助于一个数学模型来揭示总体中若干个自变量与一个因变量之间的线性依存关系,并评估用这一数学模型模拟相关事物变化规律的准确性。三、多重
6、线性回归分析的数学模型式中Yj是第i样品因变量的实测值β0为常数项,即截距βi是偏回归系数,它表示在其它自变量固定不变的情况下,Xj每改变一个测量单位时所引起的应变量Y的平均改变量εi为残差,服从N(0,σ2)分布。四、模型条件(LINE)1.线性(linear)2.独立(independent)3.正态(normal)4.等方差(equalvariance)线性(linear)指反应变量Y的总体平均值与自变量X呈线性关系。独立(independent)指任意两个记录互相独立。正态(normal)指误差
7、项服从正态分布。等方差(equalvariance)是指在自变量X取值范围内,不论X取什么值,Y都具有相同的方差。五、多重线性回归分析的基本步骤估计参数回归模型的假设检验回归系数的假设检验列出回归方程最小二乘法F检验t检验【电脑实验】数据录入【Dependent框】用于选入回归分析的应变量。【Block按钮组】由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。【Independent框】用
8、于选入回归分析的自变量。【Method下拉列表】用于选择对自变量的选入方法:Enter(强行进入法)Stepwise(逐步法)Remove(强制剔除法)Backward(向后法)Forward(向前法)在许多研究中,多重线性回归分析的目的是建立一个预测效果的最优模型,一般要求在回归模型中尽可能多的引入自变量并要求模型中的所有自变量对反应变量的影响都有统计学意义。因此需要对模型中自变量进行筛选。变量筛选自变量筛选的统计学标准SSE缩小或决定系
此文档下载收益归作者所有