SPSS-Logistic回归分析及其应用-图文课件.ppt

SPSS-Logistic回归分析及其应用-图文课件.ppt

ID:57383844

大小:398.50 KB

页数:63页

时间:2020-08-14

SPSS-Logistic回归分析及其应用-图文课件.ppt_第1页
SPSS-Logistic回归分析及其应用-图文课件.ppt_第2页
SPSS-Logistic回归分析及其应用-图文课件.ppt_第3页
SPSS-Logistic回归分析及其应用-图文课件.ppt_第4页
SPSS-Logistic回归分析及其应用-图文课件.ppt_第5页
资源描述:

《SPSS-Logistic回归分析及其应用-图文课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Logistic回归分析 及其应用iData数据分析工作室QQ:3030566369概述一般概念一元直线回归y=a+bx多元直线回归y=a+b1x1+b2x2+…+bkxk(曲线估计)-4.00-2.000.002.004.00X:自变量0.000.250.500.751.00F(y):因变量的logit值如果一定要进行直线回归也可以做出结果,但此时效果不佳。当自变量取一定值时,因变量的预测值可能为负数。Logistic回归曲线一般直线回归难以解决的问题因变量为分类变量,分类变量间的差距是不等距的如果因变量表示事件发生的概率,通常与自变量之间不存在线性关系不能保证在自变量的

2、各种组合下,因变量的取值仍限制在0~1内寻找合适的模型进行logit变换:其中:p为因变量取值为1(y=1)的概率,p/(1-p)称为发生比(OR)最终可得p值:概述小结logistic回归对因变量的发生比的对数值(logit值)建立模型因变量的logit值的改变与多个自变量的加权和呈线性关系因变量呈二项分布Logistic回归模型的估计方法最大似然估计法(Maximumlikelihoodestimation,MLE)。最大似然估计法通过最大化对数似然值(loglikelihood)估计参数。(对应于最小二乘法OLS)最大似然估计法是一种迭代算法,它以一个预测估计值作为参

3、数的初始值,根据算法确定能增大对数似然值的参数的方向和变动。估计了该初始函数后,对残差进行检验并用改进的函数进行重新估计,直到收敛为止(即对数似然不再显著变化)。理解“似然”似然(likelihood)即概率,特别是由自变量观测值预测因变量观测值的概率。与任何概率一样,似然的取值范围在0、1之间。对数似然值(loglikelihood,LL)是它的自然对数形式,由于取值范围在[0,1]之间的数的对数值负数,所以对数似然值的取值范围在0至-∞之间。对数似然值通过最大似然估计的迭代算法计算而得。Logistic回归模型的检验-2logL(似然比检验,OmnibusTest):检

4、验全部自变量的作用是否显著。较为可靠。适用于含连续性变量的情况。模型拟合好,值大,P值小。Hosmer-Lemeshow检验:评价估计概率和观察概率接近的程度。适用于含连续性变量的情况。模型好,值小,P值大。Goodness-of-fit:模型好,P值小。(只有当每个协变量模式含有大量的观测量时,才能使用该统计量。)模型中回归系数的含义回归系数表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起发生比(OR)自然对数值的变化量用发生比(OR=p/(1-p))测量自变量xi变化对发生概率的影响程度分析的一般步骤变量的编码哑变量的设置和引入(设置参照类)各个自变量的单因

5、素分析变量的筛选交互作用的引入建立多个模型选择较优的模型模型应用条件的评价输出结果的解释Logistic回归的分类二项Logistic回归(BinaryRegression)多分变量Logistic回归(MultinominalRegression)二项Logistic回归因变量只取两个值,表示一种决策、一种结果的两种可能性。例如,某个人能否拥有房子,受到多种因素的影响,如家庭情况、工龄、收入情况等,但最终的可能性只有两个,要么拥有住房,要么没有住房。我们把y=1定义为拥有住房,y=0定义为其它情况,即y=1拥有住房0其它情况从模型角度出发,不妨把事件发生的情况定义为y=1

6、,事件未发生的情况定义为y=0,这样取值为0、1的因变量可以写为下式:线性函数对x的变化在p=0或p=1的附近是不敏感的、缓慢的,且非线性的程度较高。于是我们寻找一个p的函数,使得它在p=0或p=1附近时变化幅度较大,而函数的形式又不是很复杂。因此,我们引入p的logit变换。y=1事件发生0事件未发生建立回归模型:其中,p=p(y=1)y=1拥有住房0其它情况打开二项Logistic命令二项Logistic过程主对话框选项对话框起始模型卡方检验表最终模型的拟合优度检验Hosmer-Lemeshow检验表Hosmer-Lemeshow检验的列联表最终观测量分类表最终模型统计

7、量预测方程依据预测概率的观测量分组表多分变量Logistic回归如果因变量y有J个值(即y有J类),以其中一个类别作为参考类别(baselinecategory),其他类别都同它相比较可生成J-1个非冗余(nonredundant)的logit变换模型。例如以y=J作为参考类别,则对于y=i,其logit模型为:而对于参考类别,其模型中的所有系数均为0。最后,求得第i类的概率值:另:参数估计表(ParameterEstimates)中的Exp(B)表示某因素(自变量)内该类别是其相应参考类别具有某种倾向性的倍数。以

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。