欢迎来到天天文库
浏览记录
ID:41071350
大小:216.59 KB
页数:11页
时间:2019-08-15
《SASlogistic逻辑回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、当因变量只有两个水平(如生病/健康,成功/失败),多元回归的方法将不再适用。假设我们将因变量编码,1代表生病,0代表健康,我们希望回归能得到一个0到1之间的数字,代表被试生病或健康的概率是多少。但是多元回归会得到一个负值,或者大于1,这很难解释。logistic回归可以处理这类问题。logistic回归采用logit转换是的预测方程得到0到1之间的值。logistic回归方程预测被试在某个分类中的优势的自然对数。另外,logistic回归方程的回归系数可以用于估计每个自变量的优势比。逻辑回归(logisticregression)就是被逻辑方差归化后的线性回归。
2、逻辑回归与线性回归不同,它可以处理分类变量。线性回归主要处理连续变量。例如:逻辑回归可以处理预测客户是(0)否(1)流失,这里的0、1就是分类变量;线性回归主要预测连续变量关系,提高广告投放,对产品销售的帮助曲线。假设我们有一个数据,45个观测值,四个变量,包括:age(年龄,数值型);vision(视力状况,分类型,1表示好,0表示有问题);drive(驾车教育,分类型,1表示参加过驾车教育,0表示没有)accident一个分类型输出变量(去年是否出过事故,1表示出过事故,0表示没有)。我们的目的就是要考察前三个变量与发生事故的关系。datalogistic;
3、inputaccidentagevisiondrive@@;datalines;117111440014810155001751103501042110570002801020010381004501047110520005501168101181016800148111170017011172101350111910162100391104011055000680102510017000450104401067000550116110119101690012311119001721117410131011161016110;proclogisticdata=l
4、ogisticdescending;modelaccident=agevisiondrive;run;proclogisticdata=logisticdesending;modelaccident=agevisiondrive/selection=score;run;全模型法全模型法是指在特定的模型大小范围内,找出指定的最佳模型(具有最小的CP)。通常和BEST连用,如BEST=2,就表示在不同变量个数组成的全模型组中,选择两个最好的模型,显然如果没有best选择,则全部组合数是C(N,2)。度量全模型的统计量是Cp,一般要求Cp
5、1.Cp=(n-p-1)(MS误差p/MS误差.全部-1)+(p+1)----来源网络,不知道是否可靠全模型法最大的好处是可以计算每一个变量组合下模型的C统计量以及对应的lift值,这样可以做不同模型直接的比较,缺点是计算量大。调用的SAS命令:selection=scorebest=start=stop=。其中start=选项表示最少的变量组合数,默认值是1;stop=选项表示最多的变量组合数,默认值是所有变量数SELECTION=SCORE叫最优子集法datalogistic1;inputaccidentagevisiondrive@@;datalines;
6、.1711.4400.4810.5500.7511.3501.4211.5700.2801.2001.3810.4501.4711.5200.5501.6810.1810.6800.4811.1700.7011.7210.3501.1910.6210.3911.4011.5500.6801.2510.1700.4501.4401.6700.5501.6110.1910.6900.2311.1900.7211.7410.3101.1610.6110;run;proclogisticdata=logisticdescending;modelaccident=agev
7、isiondrive;scoredata=logistic1out=oo;run;
此文档下载收益归作者所有