logistic模型及建模流程概述

logistic模型及建模流程概述

ID:33744087

大小:575.00 KB

页数:8页

时间:2019-02-28

logistic模型及建模流程概述_第1页
logistic模型及建模流程概述_第2页
logistic模型及建模流程概述_第3页
logistic模型及建模流程概述_第4页
logistic模型及建模流程概述_第5页
资源描述:

《logistic模型及建模流程概述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、标准实用Logistic模型及建模流程概述1.Logistic模型介绍1.1问题的提出在商业及金融领域中,存在这么一类问题,问题中需要被解释的目标量通常可以用YES或者NO两种取值来表示,如:l卖出了商品为YES,未卖出商品为NO;l顾客对超市的本次宣传活动做了响应为YES,没有任何响应为NO;l信用卡持卡人本月逾期付款为YES,按时还款了为NO;等等;对于这类问题的分析,我们不可以采用标准的线性回归对其进行建模分析,是因为l目标变量的二元分布违背了线性回归的重要假设l模型的目标是给出一个(0,1)之间的概率,而标准的线性回归模型产生的值是在这

2、个范围之外1.2Logistic模型对于上述问题,我们提出了logistic模型:Logistic模型可以保证:l值在-¥和+¥之间;l估计出来的概率值在0和1之间;l与事件odds()直接相关;l可以很好地将问题转化为数学问题,并且模型结果容易解释;1.3Logistics回归的假设l概率是自变量的logistics函数文案大全标准实用这样得到的概率似乎没有实际意义,只是反映一种趋势,比较大时p就会比较大取log值得到:logodds这样可以线性化,我们把这模型称为‘linearinthelog-odds’l模型假设:1)没有重要变量被忽略,

3、不包含使得系数有偏的相关变量2)不包含外来变量,包含的不相关变量会增加参数估计的标准误差,但是却不会使得系数有偏。l观测值独立l自变量的观测值没有误差1.1最大似然准则抛一枚硬币10次,结果如下:THTTTHTTTH假设结果独立,考虑得到的结果的概率,P(THTTTHTTTH)=P(T)P(H)P(T)P(T)P(T)P(H)P(T)P(T)P(T)P(H)=P(H)3[1-P(H)]7,如果我们能计算出参数P(H)的值,就能得到掷硬币结果的概率的数值。如果我们已知掷硬币的结果,如何得到P(H)的值呢?假设P=P(H),y=硬币头像一面朝上的次

4、数,n=掷硬币的次数似然函数给出了掷硬币结果的似然值,它是P的函数;最大似然估计指出P的最佳估计值是使得似然函数最大的值。为了简化计算,代替最大化L(P),我们对L(P)取log值,然后取最大值,log是单调递增函数,这样使得L(P)最大的P的值也是使得log(L(P))最大的值。最大化log似然函数,使:解出P值:1.2将最大似然估计用于logistics回归令Y=(y1,y2,y3,…,yn)是随机变量(Y1,Y2,Y3,…..Yn)的一组样本值,文案大全标准实用然后似然函数可以写成where,但是假如样本值不独立的话,此步骤就存在问题。对

5、似然函数取log值,得:令Logistics回归的似然等式对上式的参数取导数:使上面两式为零,解出参数的似然估计值。这些方程都是非线性的,所以利用迭代可以找出答案。这个过程也有可能是不收敛的。文案大全标准实用在介绍完logistic模型后,我们开始按照数据建模的流程来对各个分析环节进行讨论。1.模型设计(ModelDesign)1.1建模目标我们在对数据做分析之前,首先需要考虑的是构造模型的商业目的所在。比如说我们针对汽车贷款的数据进行分析,是希望能够估计出每笔汽车贷款人可能会发生违约的概率,从而建立一个信贷审批的决策流程。如果没有明确模型的目

6、的和用途,模型的构建工作就难进行下去。除了明确建模商业目的外,我们还需要确定模型的实施事项。比如说构建好的模型是实验模型,局域范围内使用,还是全面推广;模型的使用时间是多长;……,这些问题都需要事先考虑清楚。总的来说,我们在建模分析模型之前,需要考虑好:l我们为什么需要模型?l如何使用我们建好的模型?l谁将使用我们的模型?l模型什么时候需要?1.2数据明确了建模目标之后,我们需要系统地整理我们的数据或者说样本了。我们需要了解:l我们可能可以运用的数据有哪些;l哪些是内部数据源的数据,哪些是需要向客户索取的;l我们需要多久的数据;l数据有部分缺失

7、怎么办;l如何抽取能够代表总体的无偏样本;l是不是每个变量都有现实意义;我们还需要单独针对目标变量进行分析。在解决某些问题的时候,目标变量并不能很容易的明确下来,我们需要根据实际的业务经验,将数据做一些统计、变换,得到建模所需的目标变量值。比方说,我们在预测每位汽车贷款人发生违约的概率时,我们需要实现定义哪些贷款人发生过违约,那什么样的行为才能定义为违约呢?在美国,通常定义联系9个月以上没有还款的行为定义为违约事件,在建模时,我们将这样一批样本的目标变量定义为“1”,剩余样本的目标变量定义为“0”,然后再用logisitic模型对其建模分析。在

8、建模过程之前,我们需要对抽取出来的样本进行分成训练集、验证集和测试集,分别用于不同的建模分析阶段。文案大全标准实用1.解释变量分析(Explorato

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。