资源描述:
《stata第六讲山大陈波ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Stata上机实验离散选择模型1。二项选择模型主要包括:Probit模型(标准正态分布)Logit模型(逻辑分布)Logit模型Logit模型假定模型的误差项服从Logistic分布利用极大似然估计方法拟合,Yhat=0负的产出Yhat<>0(通常yhat=1)正的产出例如:sysuseauto,clearlogitforeignweightmpg相当于计算如下概率:Pr(foreign=1)=F(B0+B1weight+B2mpg)1。获得个体取值为1的概率。predictp1,prlistp1foreign对比一下结果,判断有正有误2。对预测准确率的判断estatcl
2、ass结果解读敏感性(Sensitivity)指即真实值取1而预测准确的概率;特异性(Specificity)是指即真实值取0而预测准确的概率。默认的门限值为0.5。3。受试者操控曲线(Receiveroperatingcharacteristic,简称为ROC曲线)是指敏感性与(1-特异性)的散点图,即预测值等于1的准确率与错误率的散点图。lroc4。goodness-of-fit拟合优度检验estatgof5。变量的边际影响回归结果中,,估计量β并非“边际效应”(marginaleffects),因此要用命令:mfxProbit模型Probit模型假定误差项的分布形式
3、为标准正态分布:回归方法和检验方法与Logit模型类似。probitforeignweightmpg注意:由于Probit与Logit所使用的分布函数不同,其参数估计值并不直接可比。雨宫(Amemiya)提出:同一个模型的logit和probit模型大概具有如下关系:Blogit约等于1.6*BProbit但利用mfx计算的两者的边际效应应该大致相同。一个综合例子使用美国妇女就业数据集“womenwork.dta”,估计决定就业的Probit与Logit模型。被解释变量为work=1,就业;work=0,不就业。解释变量为age(年龄),married(婚否),child
4、ren(子女数),education(教育年限)。usewomenwork,clearlogitworkagemarriedchildreneducationmfxestatclasspredictp1,prlistworkp1lrocestatgof注意:married是离散变量,因此执行mfx后的结果的含义不同。probitworkagemarriedchildreneducationmfxestatclasspredictp2,prlistworkp2lrocestatgoftabworktabworkifp2>0.52。多项选择模型多项Logit模型:由于可选项目
5、有多项,因此输出结果时stata将自动指定一个为基础类别(BaseOutput),显示各个变量对另外几个类别的影响系数。usebrand,cleartabbrandmlogitbrandagefemale结果分析可以利用predict提取个体选择概率predictp1p2p3list可以根据研究需要,自由地指定用来比较的baseoutcome(参照点)。mlogitbrandagefemale,base(3)排序选择模型根据GSS的调查数据,不同的家庭母亲与子女之间的关系也不同。根据调查显示,有的家庭母子(女)关系比较紧张,有的比较融洽。变量包括:warm=关系融洽度(
6、0、1、2、3);educ=子女接受教育的程度;age=子女年龄;male=儿子;prst=职业威望;white=白人;y89=89年调查结果。分析不同因素对母子(女)关系的融洽程度有何影响。useordwarm,cleartabwarm建立如下方程:ologitwarmedagemaleprstwhiteyr89oprobitwarmedagemaleprstwhiteyr89结果解读predictp1p2p3p4listp1p2p3p4计数模型1。泊松回归2。负二项回归泊松回归模型有些被解释变量只能取非负整数,即0,1,2,...,对于这一类“计数数据”,常使用“泊松
7、回归”(Poissonregression)。yi=1,2,…。我们知道,泊松分布的最大特点是条件期望和方差相等。即利用数据集poissonreg.dta估计决定初中生旷课天数(daysabs)的计数模型。解释变量为langarts(语言艺术课成绩)与male(是否男性)。usepoissonreg,clearpoissondaysabslangartsmalepredictp1,nlistmfxestatgof泊松MLE分析常常受到很多限制,如泊松分布的所有概率以及更高阶矩完全由其均值决定,特别是方差等于均值这一点有明显的局