欢迎来到天天文库
浏览记录
ID:40337423
大小:155.62 KB
页数:7页
时间:2019-07-31
《logistic回归分析影响公共交通工具的因素》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、logistic回归分析影响公共交通工具的因素一.绪论鉴于交通工具是我们出行中必不可少的一部分,而随着科技的发展与进步,交通方式愈加趋向于多元化,人们可以选择的交通工具也多种多样,新的交通工具带来便利的同时,也不可避免的给我们带来了一些问题。不同社会地位的人所选择的交通工具的原因与其本身的内在因素以及外部条件相关。不同的年龄,性别,收入都是影响人们交通方式的重要因素。应用Logistic回归的原理和计算方法,并利用在公共交通调查数据在一次关于公共交通的社会调查中,年龄,月收入,性别与是乘公共汽车上下班还是骑自行车上下班的资料,采用Logistic回归方法,进行假设检验,对影响的因素
2、进行分析。建立Logistic回归模型,更加明确因变量与自变量之间的关系。二.Logistic回归理论logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。由于Y取值非0即1,如设Y取1的概率为P,则它取0的概率为Q=1-P。第i个观察对象的发生概率比数(odds)为称为发生比,是发生概率与不发生概率的比。发生概率取对数称为LOGIT变换。回归系数的解释,β,i表示xi改变一个单位时,logitP的平均变化量。相对危险度:RR=P1/P2比数:Odds=P/(1-P)比数比:OR=对
3、比数比取自然对数得到关系式:β的意义是在其他自变量固定不变的情况下,自变量X的水平没改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量X的水平每增加一个测量单位时所引起的比数比为增加前的倍。Logit回归模型实质是求一种概率的估计,将某种概率与一个线性模型联系起来。三.实例3.1原始数据因变量y=1表示乘坐公共汽车,y=0表示骑自行车。自变量x1是年龄,作为连续变量;x2是月收入,x3是性别,x3=1表示男性,x3=0表示女性,调查对象为工薪族群体。表1公共交通社会调查序号年龄x1月收入x2性别x3交通y1188500022112000
4、032385001423950015281200016318500073615000184210000194695001104812000011551800011256210001135818000114188501015201000101625120010172713001018281500101930950112032100010213318001022331000102338120010344115001025451800112648100010275215001128561800113.2程序与分析3.2.1程序datasasa;inputnx1x2x3y;dataline
5、s;118850002211200003238500142395001528120001631850007361500018421000019469500110481200001155180001125621000113581800011418850101520100010162512001017271300101828150010193095011203210001021331800102233100010233812001024411500102545180011264810001027521500112856180011;proclogisticdata=sasadesend
6、ing;modely=x1x2x3/selection=stepwise;Run;3.2.2运行结果分析3.2.2.1输入数据信息Logistic回归方程log(odds)默认的形式是处理那个变量值比较小的,由运行结果可以看得出,因变量y取值的排列顺序是从大到小,所以第一个可能概率模型为y=1。3.2.2.2引入变量给出了自变量进入模型的次序。先是截距项Step0了,step1x3第一个进入模型,附带了很多评估它对因变量预测能力的指标。-2LogL和Score用来检测自变量是否显著。-2LogL中的L就是LikelihoodRatio,它的p值是0.0108,Score的p值是0.
7、0125,wald的p值为0.0173,都小于0.05,故x3是一个很显著的解释变量。AIC和SC两个信息量标准用来比较不同的模型,它们数值越小,模型变现就越好,step2x1变量进入模型后的情况,模型的情况变化不大,step2x1变量移除模型后的情况比step2的情况好,AIC和SC的值变小了,-2LogL和Score对应的p值也更小。3.2.2.3模型的总体检验由运行结果可以看出,p<0.05,所以模型有较好的拟合效果。3.2.2.4参数检验以及几个描述性统计量、
此文档下载收益归作者所有