欢迎来到天天文库
浏览记录
ID:25231319
大小:2.87 MB
页数:30页
时间:2018-11-18
《离散选择摸型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第12章离散选择模型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型。这里主要介绍Tobit(线性概率)模型,Probit(概率单位)模型和Logit模型。12.1Tobit(线性概率)模型Tobit模型的形式如下,yi=a+bxi+ui(12.1)其中ui为随机误差项,xi为定量解释变量。yi为二元选择变量。此模型由JamesTobit提出,
2、因此得名。如利息税、机动车的费改税问题等。设1(若是第一种选择)yi=0(若是第二种选择)对yi取期望,E(yi)=a+bxi(12.2)下面研究yi的分布。因为yi只能取两个值,0和1,所以yi服从两点分布。把yi的分布记为,pi=P(yi=1)1-pi=P(yi=0)则E(yi)=1(pi)+0(1-pi)=pi(12.3)由(2)和(3)式有pi=a+bxi(yi的样本值是0或1,而预测值是概率。)(12.4)以pi=-0.2+0.05xi为例,说明xi每增加一个单位,则采用第一种选择的概率增加0.05。假设用这个模型进行预测,当预测值落在[0,1]区
3、间之内(即xi取值在[4,24]之内)时,则没有什么问题;但当预测值落在[0,1]区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是[0,1],所以此时必须强令预测值(概率值)相应等于0或1(见图12.1)。线性概率模型常写成如下形式,-242-图12.11,a+bxi³1pi=a+bxi,04、的。由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(zi)能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型。累积正态概率分布曲线logistic曲线12.2Probit(概率单位)模型,仍假定yi=a+bxi,而pi=F(yi)=5、(12.6)累积概率分布函数曲线在pi=0.5附近的斜率最大。对应yi在实轴上的值,相应概率值永远大于0、小于1。显然Probit模型比Tobit模型更合理。Probit模型需要假定yi服从正态分布。-242-12.3logit模型该模型是McFadden于1973年首次提出。其采用的是logistic概率分布函数。其形式是pi=F(yi)=F(a+bxi)==(12.7)对于给定的xi,pi表示相应个体做出某种选择的概率。Probit曲线和logit曲线很相似。两条曲线都是在pi=0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。利用(126、.6)和(12.7)式得到的概率值见表12.1。表12.1Probit模型和logit模型概率值yi正态分布函数pi=逻辑概率分布pi=-3.00.00130.0474-2.00.02280.1192-1.50.06680.1824-1.00.15870.2689-0.50.30850.37750.00.50000.50000.50.69150.62251.00.84130.73111.50.93320.81762.00.97720.88083.00.99870.9526pi1.0logit曲线0.5Probit曲线0yi图12.2Probit曲线、logi7、t曲线比较示意图logit曲线近似于自由度为4的t分布曲线。Probit曲线和logit曲线都是在pi=0.5处有拐点,但logit曲线在两个分布的尾部要比Probit曲线厚。且计算上也比较方便,所以Logit模型比Probit模型更常用。对上式作如下变换,pi(1+)=1(12.8)对上式除以pi,并减1得e-yi=-1=取倒数后,再取对数,yi=log()所以log()=yi=a+bxi(12.9)由上式知回归方程的因变量是对数的某个具体选择的机会比。logit模型的一个重要优点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比8、问题。logit累积概率分布函数的斜率在pi=0.5
4、的。由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(zi)能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型。累积正态概率分布曲线logistic曲线12.2Probit(概率单位)模型,仍假定yi=a+bxi,而pi=F(yi)=
5、(12.6)累积概率分布函数曲线在pi=0.5附近的斜率最大。对应yi在实轴上的值,相应概率值永远大于0、小于1。显然Probit模型比Tobit模型更合理。Probit模型需要假定yi服从正态分布。-242-12.3logit模型该模型是McFadden于1973年首次提出。其采用的是logistic概率分布函数。其形式是pi=F(yi)=F(a+bxi)==(12.7)对于给定的xi,pi表示相应个体做出某种选择的概率。Probit曲线和logit曲线很相似。两条曲线都是在pi=0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。利用(12
6、.6)和(12.7)式得到的概率值见表12.1。表12.1Probit模型和logit模型概率值yi正态分布函数pi=逻辑概率分布pi=-3.00.00130.0474-2.00.02280.1192-1.50.06680.1824-1.00.15870.2689-0.50.30850.37750.00.50000.50000.50.69150.62251.00.84130.73111.50.93320.81762.00.97720.88083.00.99870.9526pi1.0logit曲线0.5Probit曲线0yi图12.2Probit曲线、logi
7、t曲线比较示意图logit曲线近似于自由度为4的t分布曲线。Probit曲线和logit曲线都是在pi=0.5处有拐点,但logit曲线在两个分布的尾部要比Probit曲线厚。且计算上也比较方便,所以Logit模型比Probit模型更常用。对上式作如下变换,pi(1+)=1(12.8)对上式除以pi,并减1得e-yi=-1=取倒数后,再取对数,yi=log()所以log()=yi=a+bxi(12.9)由上式知回归方程的因变量是对数的某个具体选择的机会比。logit模型的一个重要优点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比
8、问题。logit累积概率分布函数的斜率在pi=0.5
此文档下载收益归作者所有