如何使用SPSS对Logistic回归中分类变量进行处理

如何使用SPSS对Logistic回归中分类变量进行处理

ID:39326359

大小:137.26 KB

页数:4页

时间:2019-06-30

如何使用SPSS对Logistic回归中分类变量进行处理_第1页
如何使用SPSS对Logistic回归中分类变量进行处理_第2页
如何使用SPSS对Logistic回归中分类变量进行处理_第3页
如何使用SPSS对Logistic回归中分类变量进行处理_第4页
资源描述:

《如何使用SPSS对Logistic回归中分类变量进行处理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Y0J><@A0NZ@4H=I@425@AZ=G252<=[0A"7]^))##&文章编号!"##$%$&&’()##&*#)%#""#%#&中图分类号!+&""文献标识码!,如何使用-.--对/0123425回归中分类变量进行处理邹宗峰林汉生(暨南大学医学院卫生统计学教研室广州6"#7&)*摘要!介绍了/0123425回归分析中常见的分类变量的编码方法和在-.--统计软件中的实现方法8使分类变量的编码技术在/0123425回归分析中得到更好的应用9关键词!分类变量:/0123425回归:-.--统计软件医学研究中8我们经常用/0123425回归分析来研究因变量

2、我们只引入&个而不是$个变量的原因是因为当我们引入取值仅有两个或几个的情况8比如是否发病;死亡或者痊愈$个变量时8该回归方程将没有唯一解9由定类变量分类的R穷等9从/0123425回归的性质来看8它是在控制其它变量的前提举S与R互斥S原则所决定8知道任意三个变量的值就一定可推下8用某一自变量的变化量来说明因变量的变动8它要求其变出第四个变量的实际数值9因为回归方程的一个必然条件就量的测量尺度应该是定距层次(2<4=>?@A*上的9然而8在实际研是任一自变量不能由其它自变量线性导出9在多元回归分析究中8许多有待分析的数据却往往是分类变量(5@4=10>25@A中8这被

3、称为极端的多重共线性问题9在编码时被剔除的变量?@>2@BA=*8类有序及相邻类之间等间距的假设都没有得到证虽无法引入回归方程8但它在解释该方程最后结果时却具有实9因而8统计分析中对于分类变量的编码并无实际的数值意重要意义9它被称为参照变量(>=N=>=<5=?@>2@BA=*8作为其它义8而仅有标识作用9例如8研究煤气中毒预后与高压氧治疗变量与之进行比较的基础9可以应用简单编码的例子如评价的关系8我们研究的是是否进行过高压氧治疗8不论是进行了治疗措施的疗效!无效;好转;治愈8对此编码我们就可以引入多少次治疗8我们都只记做有治疗8CC次和"次是一样的9但是两个变量进

4、行编码9如果我们简单的将它的情况编码为(#D没有;"D有*8就是把EFLFL指标编码(T=?2@420<50G2<1*通过对比指出该类别他们数值化了8这样CC次和"次的效应就会不同9的成员是否存在8对比的参考类别是用一整列的零来表示9离差编码是将分类变量中的某一类别作为参照类8用多元回归E分类变量的编码分析的结果来说明其它类别与该类别的差异9这样8参照变量EFE二分变量的编码的选择对于研究理论的最后说明就变得极其重要9然而8在许二分变量只是定类变量中最简单的一种8也可说是特殊多研究中8或者难以选出作为对比基础的参照类别8或者类别的一种9性别为定类变量中最为简单的形式

5、8即二分变量(G2%间的比较理论价值不大8研究者也许更重视各类别与总体平5H040I0J3=?@>2@BA=*8对此8只需将性别编码为!"D男8#D均水平之间的比较8这时就适合于指标编码9女9我们把定类变量编码为#;"的形式称为虚拟变量(GJIIK依然以对工作状态的编码为例!?@>2@BA=*9在实际研究中8被处理的对象很多情况下分为三类;工作状态Q"Q)Q&四类甚至更多8因此8我们在此侧重研究对三分以上的定类变全职工作"##量的处理9兼职工作#"#EFL多分变量的编码失去劳动能力##"我们在这里以一个对工作状态的描述的例子来阐述9西失业U"U"U"方研究者常把工作

6、状态分为!全职工作(=IMA0K=GNJAA%42I=*;兼职工作(=IMA0K=GM@>4%42I=*;失去劳动能力(J<@BA=40对于全职工作;兼职工作;失去劳动能力者的编码如同简O0>P*及失业(<04=IMA0K=G*9这是一个四分变量8对此作虚拟单编码8只是对失业者的编码从#变为了U"9指标编码也存在编码9着缺陷8由于最后进行回归方程的变量只能有VU"个8这样就EFLFE离差编码(250G2<1*我们引入&个虚拟变量无法直接知道第V个类别相对于总体平均水平的差异9如上(GJIIK?@>2@BA=*Q";Q);Q&如下!例中8我们就无法直接

7、获知处于失业状态的研究对象的因变工作状态Q量效应相对于总体平均水平的差异9但由于各群体相对于总"Q)Q&全职工作"##体水平差异之和为零8则它的数值可以通过运算得出9兼职工作#"#EFLFW对比编码(50<4>@3450G2<1*在回归分析分类变量的失去劳动能力##"编码方法中8最为灵活及研究控制度最高的方法是对比编码9失业###它能按照研究者需要8将变量中具有同一性质的类别群与另万方数据X""#X数理医药学杂志%((&年第$-卷第%期一性质的类别群进行对比!依旧以工作状态的编码为例"成员是否存在5对比的参考类别是用一整列的零来表示!工作状态#TUVUW多项式编

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。