统计学教案习题11多元线性回归与logistic回归

统计学教案习题11多元线性回归与logistic回归

ID:17638016

大小:390.00 KB

页数:8页

时间:2018-09-04

统计学教案习题11多元线性回归与logistic回归_第1页
统计学教案习题11多元线性回归与logistic回归_第2页
统计学教案习题11多元线性回归与logistic回归_第3页
统计学教案习题11多元线性回归与logistic回归_第4页
统计学教案习题11多元线性回归与logistic回归_第5页
资源描述:

《统计学教案习题11多元线性回归与logistic回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十一章多元线性回归与logistic回归一、教学大纲要求(一)掌握内容1.多元线性回归分析的概念:多元线性回归、偏回归系数、残差。2.多元线性回归的分析步骤:多元线性回归中偏回归系数及常数项的求法、多元线性回归的应用。3.多元线性回归分析中的假设检验:建立假设、计算检验统计量、确定值下结论。4.logistic回归模型结构:模型结构、发病概率比数、比数比。5.logistic回归参数估计方法。6.logistic回归筛选自变量:似然比检验统计量的计算公式;筛选自变量的方法。(二)熟悉内容常用统计

2、软件(SPSS及SAS)多元线性回归分析方法:数据准备、操作步骤与结果输出。(三)了解内容标准化偏回归系数的解释意义。二、教学内容精要(一)多元线性回归分析的概念将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量与多个自变量X间的线形依存关系,称为多元线形回归(multiplelinearregression),简称多元回归(multipleregression)基本形式:式中为各自变量取某定值条件下应变量均数的估计值,,,…,为自变量,为自变量个数,为回归方程常数项,也称为截距,其意义同

3、直线回归,,,…,称为偏回归系数(partialregressioncoefficient),表示在除以外的自变量固定条件下,每改变一个单位后的平均改变量。(二)多元线性回归的分析步骤是与一组自变量,,…,相对应的变量的平均估计值。多元回归方程中的回归系数,,…,可用最小二乘法求得,也就是求出能使估计值和实际观察值的残差平方和为最小值的一组回归系数,,…,值。根据以上要求,用数学方法可以得出求回归系数,,…,的下列正规方程组(normalequation):式中 常数项可用下式求出:(三)多元线性

4、回归分析中的假设检验在算得各回归系数并建立回归方程后,还应对此多元回归方程作假设检验,判断自变量,,…,是否与真有线性依存关系,也就是检验无效假设(),备选假设为各值不全等于0或全不等于0。检验时常用统计量式中为个体数,为自变量的个数。式中(四)logistic回归模型结构设为一组自变量,为应变量。当是阳性反应时,记为=1;当是阴性反应时,记为=0。用表示发生阳性反应的概率;用表示发生阴性反应的概率,显然+=1。Logistic回归模型为:同时可以写成:式中是常数项;是与研究因素有关的参数,称为偏

5、回归系数。事件发生的概率与之间呈曲线关系,当在之间变化时,或在(0,1)之间变化。若有例观察对象,第名观察对象在自变量作用下的应变量为,阳性反应记为=1,否则=0。相应地用表示其发生阳性反应的概率;用表示其发生阴性反应的概率,仍然有+=1。和的计算如下:这样,第个观察对象的发病概率比数(odds)为,第个观察对象的发病概率比数为,而这两个观察对象的发病概率比数之比值便称为比数比(oddsratio)。对比数比取自然对数得到关系式:ln等式左边是比数比的自然对数,等式右边的是同一因素的不同暴露水平与

6、之差。的流行病学意义是在其它自变量固定不变的情况下,自变量的暴露水平每改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量的水平每增加一个测量单位时所引起的比数比为增加前的倍。同多元线性回归一样,在比较暴露因素对反应变量相对贡献的大小时,由于各自变量的取值单位不同,也不能用偏回归系数的大小作比较,而须用标准化偏回归系数来做比较。标准化偏回归系数值的大小,直接反映了其相应的暴露因素对应变量的相对贡献的大小。标准化偏回归系数的计算,可利用有关统计软件在计算机

7、上解决。(五)logistic回归参数估计由于logistic回归是一种概率模型,通常用最大似然估计法(maximumlikelihoodestimate)求解模型中参数的估计值。为在作用下的阳性事件(或疾病)发生的指示变量。其赋值为:第个观察对象对似然函数的贡献量为:当各事件是独立发生时,则个观察对象所构成的似然函数是每个观察对象的似然函数贡献量的乘积,即式中∏为从1到的连乘积。依最大似然估计法的原理,使得达到最大时的参数值即为所求的参数估计值,计算时通常是将该似然函数取自然对数(称为对数似然函

8、数)后,用Newton—Raphson迭代算法求解参数估计值。(六)logistic回归筛选自变量在logistic回归中,筛选自变量的方法有似然比检验(likelihoodratiotest)、计分检验(scoretest)、Wald检验(Waldtest)三种。其中似然比检验较为常用,用Λ表示似然比检验统计量,计算公式为:式中为自然对数的符号,为方程中包含个自变量的似然函数值,为在方程中包含原个自变量的基础上再加入1个新自变量后的似然函数值。在无效假设条件下,统计量Λ服从自由度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。