欢迎来到天天文库
浏览记录
ID:20981368
大小:283.00 KB
页数:36页
时间:2018-10-17
《stata做logistic回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、应用Stata做logistic回归何保昌实际生活中经常会遇到因变量只有0和1的二分类变量,不能满足正态性和方差齐性,故不能直接使用线性模型来拟合方程。Logistic回归正是处理因变量是二分类或多分类变量的一种方法。现已广泛应用于队列研究,病例对照研究和试验性研究,成为分类因变量的首选多变量分析模型。分类按因变量性质,可分为二分类、无序多分类、有序多分类。按是否匹配可分为非条件和条件logistic回归。Stata软件专门有一组命令用于做不同类型的logistic回归,例如:logit、blogit、glogit、clogit、mlo
2、git、ologit。1.Logistic回归命令:logit因变量[自变量][,选择项]在进行logistic回归时要注意资料的形式。通常,用于logistic回归的资料有三种形式:(1)分水平频数资料,一般自变量较少,且均为分类变量,常以各变量(包括因变量、自变量)各水平的组合的频数表形式出现。如例1。拟合时仍用上述命令,只是命令中增加[fw=频数变量]选择项。(2)分组频数资料,一般自变量较少,且均为分类变量,常以各自变量(不包括因变量)各水平的组合的频数表形式出现,因变量常表达为分子与分母。如例2。用下列命令:blogit阳性数
3、变量总观察数变量[,logit命令选择项]或glogit阳性数变量总观察数变量[,level(#)or](3)个体水平资料,即一个观察对象一条记录。如例3,直接使用logit命令估计即可。拟合模型后可以用指令predict得到预测概率,然后进行模型诊断、应用等。例1本例是探讨妇女使用雌激素与患子宫内膜癌之间关系的病例-对照研究资料,见表1,请计算OR及其95%可信区间。再用logistic回归估计参数,写出回归方程,并说明回归系数与OR的关系。也可以用logit命令可以利用例3做逐步回归Stata用于逐步回归分析的命令是在要执行的命令前
4、增加sw。sw回归命令[因变量[自变量]],筛选变量的P值[选择项]其中,筛选变量的P值有3种组合pr(#)/*后退法pe(#)/*向前法pr(#)pe(#)/*逐步后退法pr(#)pe(#)forward/*逐步向前法pr(#)是剔除变量的P值,pe(#)是选入变量的P值,如果只选pr(#),则表示用后退法,如果同时选用pr(#)和pe(#)表示逐步法。应用时,为防止计算进入死循环,pr(#)须略大于pe(#)。例如,pe(0.05),pr(0.051)。1.用逐步后退法,剔选变量的概率为:pe(0.05),pr(0.06),结果如下
5、:swlogityx1x2x3,pe(0.05)pr(0.06)2.用逐步前进法,剔选变量的概率不变,结果如下:swlogityx1x2x3,pr(0.06)pe(0.05)forward条件logistic回归非条件logistic回归适用于平行组设计的病例-对照研究,队列研究,而不适用于配比设计的病例-对照研究。对于配比的病例-对照研究资料需要用条件logistic回归。其命令为:clogit因变量[自变量],group(配比变量)[level(#)or]其中group()是必选项,它是用来区分各配比组的。level(#)及or的意
6、义同logit。例4在子宫内膜癌与使用雌激素关系的研究中,运用了1:4的病例-对照研究,配比因素为年龄,共调查了20对,100例。各变量定义如下:1:match配比组2:yy=1:病例,y=0:对照3:htht=0:无高血压,ht=1:有高血压4:estest=0未使用过雌激素,est=1:使用过雌激素5:dose剂量:dose=0:未使用过,dose=1:0.1-0.299(mg/day)6:drugdrug=0:未使用其他药物,drug=1:使用了其他药物首先,使用ht、est、drug三个变量作条件logistic回归。.clog
7、ityhtestdrug,group(match)结果显示,患高血压(ht)及使用其他药物(drug)与子宫内膜癌无关,而使用过雌激素者患子宫内膜癌的可能性比未使用过雌激素者大。因此,可以进一步考虑剂量-反应关系。变量剂量(dose)可以按两种方法处理,先按线性形式进入模型,再以哑变量形式进入模型,并比较两者的结果。clogityhtdosedrug,group(match)结果显示,随着剂量的上升,服用雌激素与患内膜癌间的联系也明显上升,呈现出明显的剂量-反应关系。这种关系是否为线性的?dose用哑变量形式是否更好?xi:clogit
8、yhti.dosedrug,group(match)多类结果的logistic回归在医学研究中,常常会遇到结果变量是多分类的情况,如同一种肿瘤的不同亚型;病例-对照研究中的一个对照组,两个或多个病例组;或一
此文档下载收益归作者所有