logistic判别分析应用

logistic判别分析应用

ID:11214857

大小:187.50 KB

页数:5页

时间:2018-07-10

logistic判别分析应用_第1页
logistic判别分析应用_第2页
logistic判别分析应用_第3页
logistic判别分析应用_第4页
logistic判别分析应用_第5页
资源描述:

《logistic判别分析应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、利用-Logistic回归二次判别法提高判别分析效率朱勇华张庆丰华北电力大学,北京,102206三、利用Logistic回归提高判别分析效率,一般情况下,距离判别分析对资料的基本要求是:分组类型在两组或两组以上;在第一阶段工作时每组案例的规模必须至少在一个以上;预测变量必须是可测量的以计算其平均值和方差来得到相应的统计函数。另外还需要有一定的假设条件:1、每一个判别变量(预测变量)不能是其他的判别变量的线性组合;2、各组变量的协方差矩阵相等;3、各判别变量之间具有多元正态分布。与此相比,Logistic

2、回归没有类似假设,而且当这些假设不满足时结果非常稳定,具有很好的稳健性。比如我们可以采用主成分分析来有效减轻预测变量之间的多元共线性,当预测变量是非度量变量是可以采用引入哑变量的方法来进行回归从而达到判别个体归属的目的等。从另一个方面讲,判别分析实际上是一种针对资料结构进行的分析方法,而回归分析则是基于资料之间的相关关系进行的分析方法,可以说这两种方法各有长处,将这两种方法的优点进行结合,显然有助于我们的分析。接下来我们看一下具体操作方法。首先需要确定判别准则,Logistic回归意在对回应变量Y取0或

3、1两个值的概率建模。由此,我们可以根据预测变量X的不同水平来计算的预测概率。如果所得预测概率值相当大,那么我们当然要预测要发生了。反之如果预测概率相当小,我们当然要预测要发生了。这里存在一个问题即如何确定所谓“相当大"或“相当小"。也就是如何确定这两者之间的分割点。关于如何确定分割点目前主要存在以下几种做法:1、采用0.5作为分割点;2、选用“最佳"分割点;3、根据先验概率和误判损失来确定分割点。Y=1Y=1Y=0在此,我们推荐采用一种新的确定分割点的方法,即二阶段判别的方法。所谓二阶段判别,即在第一阶

4、段,分别尝试用距离判别法和Logistic回归进行模型拟合,如果效果很好,可以考虑判别分析到此为止。反之,根据Logistic回归得到的预测概率值选定一个筛选标准将样本分为三类:“1"组、“0"组和“不确定"组,然后对不确定组的样本采用第三种方法,即根据先验概率和误判损失来确定分割点。这样的话我们就可以最大限度地发挥Logistic回归的模型优势并且可以充分利用样本信息。为了进一步说明理论依据,我们采用图示的方法进行说明:假设样本分布如上图,我们显然可以首先将分布区域Ⅰ、Ⅲ中的样本做出判别,然后再依据样

5、本在区域Ⅱ中的频数信息确定分割点以对分布区域Ⅱ中的样本点进行判别。此例中,如果直接依据总样本的频数信息来进行判别的话显然有些不合理。特别刊管理科学与统计决策Specialissue2006年11月ManagementScience&StatisticalDecisionNov.200660四、案例验证为了了解学习口语和交际策略对于英语学习的影响,以研究对策,改进教学和学习方法,从而最终使广大同学更快更好地学习英语,我们搞了一个问卷调查。具体调查结果见下表:表1关于英语口语学习与交际策略的调查分析表IDY

6、X1X2X3X4X5X6PG1G2112.51.882.832.221.50.06079112132.252.672.22.171.830.088911313.752.252.672.62.52.170.1891411412.752.3832.42.171.50.18491115132.53.672.62.172.50.0888116132.63332.6730.14638117132.753.833.42.332.670.3512311813.752.752.833.433.170.387621191

7、32.883.172.82.52.830.157651110133432.52.830.22117111113.2533.532.332.330.40597111213.53.132.833.233.330.32839111313.53.132.833.233.330.32839111413.753.133.172.82.332.670.32223111513.53.2532.42.332.330.26847111614.53.253.173.83.53.670.70461221713.253.383.

8、333.23.333.170.43879111813.753.383.672.62.172.50.33002111913.53.52.832.62.832.170.5473221*20143.53.53.62.832.670.83607222113.53.6332.82.172.830.382421122143.6343.833.670.67922222323.52.52.1721.671.830.09859112423.52.633.17

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。