【精品】LR和假设检验

【精品】LR和假设检验

ID:43045643

大小:601.29 KB

页数:50页

时间:2019-09-25

【精品】LR和假设检验_第1页
【精品】LR和假设检验_第2页
【精品】LR和假设检验_第3页
【精品】LR和假设检验_第4页
【精品】LR和假设检验_第5页
资源描述:

《【精品】LR和假设检验》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、LogisticRegression&HypothesisTesting武玉兰(思思)yulan.wu@langtaojin.com2011-10-12Outline■LogisticRegression□Maximumlikelihoodestimation(MLE)□LogisticcurveNumericalOptimizationLRcoefficientsexplanationStatisticalhypothesistesting□SignificancetestingLRcoefficientsignificancetestingLRcoefficientconfidencei

2、ntervalsLRmodelevaluationLRfeatureselectionLRproblemsMLE-Maximumlikelihoodestimation■Maximumlikelihoodestimation最大似然估计□一种参数估计方法,被用来求一个样本集的相关概率密度函数(pdf)的参数。■基本思想:□例如:我们有10个广告,展示了很多次了,其中有一个广告A个被点击的次数最多。当我们要寻找一个概率函数来预测这10个广告哪一个更容易被点击时,那我们所找的概率函数(参数)应该使A广告点击概率最大。□使试验已得结果的发生概率最大化■求MLE的一般步骤:□条件:观测样本遵从iid

3、(independentandidenticallydistributed)□给出每个样本观测结果的概率函数□因为遵从iid条件,所以可以给出观测样本集的联合概率(即似然函数)函数□对似然函数取对数(即对数似然函数loglikelihood)□求使得对数似然函数最大时的参数估计Logisticcurve(sigmoidcurve)1l+e~gM^—logisticcurve其中,g(x)=00+0內+02兀2・・・+0届LRModeling建模:以具有n个独立变量的向量[xp...,xj来标识一个观测量,设条件概率P(Y=1

4、x)=p为根据观测量相对于某事件(比如观测量为一个广告,事件是被点

5、击)发生的概率。定义事件发生的概率为:P(Y=11兀)=7T(X)=1l+e~gM(式I)g(X)=00+0內+02吃…+禹£(式1□定义事件不发生的概率为:P(Y=0x)=1-P(Y=1x)1严)1=1=1=1+八⑴1+幺曲)1+幺曲)事件发生与不发牛之比的对数:ln(P1-)=g(X)=00+0內+02吃…+齢(式1・3)(式1-4)LR-MLE■假设有m个观测样本,观测值分别是儿力,…,儿,设〃产=为给定条件下得到xt的概率。在同样条件下得到必=。的概率为P(y.=Olxz)=l-A.。于是,得到一个观测值的概率为:P(yj=pg-pjr(式1.5)■假设各项观测独立,那么这m个观

6、测样本的联合分布可以表示为各边际分布的乘积(似然函数):m/(0)=H兀(兀尸[1一〃(兀)]宀(式1.6)■对数似然函数:乙(0)=1叩(0)]=lnwa)]+(l——”3)]}(式1.7)■MLE目标:求出使似然函数的值最大的参数估计(极值问题)NumericalOptimization-NewtonRaphson■Taylorexpansion:□设厶(0)是二次可微实函数,,又设0")是厶(0)极值点的一个估计,将厶(0)在0(「)处展开成二阶Taylor级数:(0-府))+希(0-0丁)+.・.+誅H

7、yf力2/合2[+{顾("础X0—0⑺("外)(0一炉)+…+^^(0一0『)(

8、0一府)d2L厶(0)w(0)=乙(0))+d2Ld2Ld2L+…丽〒m“)}=厶(0"))+(0—0⑺yzA/?⑴)+丄(0—0"))q"(0"))(0—0⑺)(式2.1)为简便,不考虑0(110—万II),0(110-万II)是当110-万II->0时,关于110-万II的高阶无穷小量■极值点(平稳点),匚阶导数为0,即:0=0(0)=L'(0(「)r+

9、[L”(0㈤)(0_0(「))+(0—0(「)卩L"(0(「))]=D(0('))+Z/(0°))(0—0(。)(式2.2)NumericalOptimization-NewtonRaphson■设"(0E)可逆,由(式22)得到牛顿法

10、(Newton-Raphson)的迭代公式(用0(刊替代0符号):(式2.3)0(“1)=0(r)+d(r)0(川)=0(「)_l”(0(门)-.L'(0(°)其中,L(3^yx是Hessian矩阵厶”(0(门)的逆矩阵。这样,当知道0⑴后,计算出在这一点处的目标函薮的梯度和Hessian矩阵的逆,代入上式,便得到后继逼近点严。依次迭代,产生序列{0")}。在适当条件下,这个序列收敛。其中,护)=-£/(刖

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。