spss高级课程2

spss高级课程2

ID:34489043

大小:839.45 KB

页数:23页

时间:2019-03-06

spss高级课程2_第1页
spss高级课程2_第2页
spss高级课程2_第3页
spss高级课程2_第4页
spss高级课程2_第5页
资源描述:

《spss高级课程2》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2012年6月13日统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)第七讲logistic回归@文彤老师统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)模型简介基于线性回归模型发展而来线性回归研究的是连续性应变量与自变量之间的关系有的时候应变量为分类变量,需要研究该分类变量与一组自变量之间的关系以治疗效果为应变量,结局为治愈/未治愈如果使用新的宣传方式,决定戒烟的概率是否更高?@文彤老师2010年6月13日2统计软件系列课堂人大经济论

2、坛—培训中心出品(www.pinggu.org)模型简介Yˆxx11mmPˆxx11mm发生率P为应变量,它与自变量之间通常不存在线性关系不能保证在自变量的各种组合下,应变量的取值仍限制在0~1内@文彤老师2010年6月13日312012年6月13日统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)模型简介plogit(p)ln1plogit(p)xx11mm由于应变量为二分类,所以误差项服从二项分布,而不是正态分

3、布。因此,常用的最小二乘法也不再适用。@文彤老师2010年6月13日4统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)模型用途影响因素分析,求出哪些自变量对应变量发生概率有影响。并计算各自变量对应变量的比数比。作为判别分析方法,来估计各种自变量组合条件下应变量各类别的发生概率,从而对结局进行预测。该模型在结果上等价于判别分析@文彤老师2010年6月13日5统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)模型简介logit(p)x

4、x11mmα是常数项,表示自变量取值全为0时,比数(Y=1与Y=0的概率之比)的自然对数值Beta为logistic回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起比数比(OR)自然对数值的变化量@文彤老师2010年6月13日622012年6月13日统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)案例:低出生体重儿影响因素Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素,数据见文件logistic_step.s

5、av。结果变量为是否娩出低出生体重儿(变量名为LOW,1,低出生体重,即婴儿出生体重<2500克、0,非低出生体重),考虑的影响(自变量)有:产妇妊娠前体重(lwt,磅)产妇年龄(age,岁)产妇在妊娠期间是否吸烟(smoke,0=未吸、1=吸烟)本次妊娠前早产次数(ptl,次)是否患有高血压(ht,0=未患、1=患病)子宫对按摩、催产素等刺激引起收缩的应激性(ui,0=无、1=有)妊娠前三个月社区医生随访次数(ftv,次)种族(race,1=白人、2=黑人、3=其他民族)@文

6、彤老师2010年6月13日7统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)模型中用到的检验方法Walds检验:基于标准误估计值的单变量检验他没有考虑其他因素的综合作用,当因素间存在共线性时结果不可靠故在筛选变量时,用Walds法应慎重似然比检验:直接对两个模型进行的比较当模型较为复杂时,建议使用似然比检验进行变量的筛选工作,以及模型间优劣的比较两模型-2对数似然值之差即为似然比统计量,自由度亦为两模型参数个数之差比分检验考虑在已有模型基础上引入新变量之

7、后模型效果是否发生改变@文彤老师2010年6月13日8统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)哑变量回归系数b表示其它自变量不变,x每改变一个单位时,所预测的y的平均变化量当x为连续性/二分类变量时这样没有问题当x为多分类变量时就不太合适了无序多分类:民族,各族之间不存在大小问题有序多分类:家庭收入分为高、中、低三档,它们之间的差距无法准确衡量强行规定为等距显然可能引入更大的误差@文彤老师2010年6月13日932012年6月13日统计软件系列课堂人

8、大经济论坛—培训中心出品(www.pinggu.org)哑变量在以上这些情况时,我们就必须将原始的多分类变量转化为数个哑变量(DummyVariable),每个哑变量只代表某两个级别或若干个级别间的差异,这样得到的回归结果才能有明确而合理的实际意义。注意:哑变量必须同进同出,否则含义可能改变@文彤老师2010年6月13日10统计软件系列课堂人大经济论坛—培训中心出品(www.pinggu.org)哑变量O型是作为对比水平(基础水平),而哑变量V1、V2、V3分别代表了A型、B型、AB型和O

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。