分类数据与相关模型

分类数据与相关模型

ID:45907875

大小:1.56 MB

页数:91页

时间:2019-11-19

分类数据与相关模型_第1页
分类数据与相关模型_第2页
分类数据与相关模型_第3页
分类数据与相关模型_第4页
分类数据与相关模型_第5页
资源描述:

《分类数据与相关模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分类变量及相关模型分类变量与分类选择模型分类变量与变参数模型43分类选择模型一、被解释变量为分类变量的情形二、二元分类模型线性模型的局限概率模型的基本思路Logit模型和Probits模型三、多元分类模型(有序模型、截断模型)在某些特定的场合,被解释变量也表现为定性的虚拟变量或某种分类变量。例1:研究成年男性劳动参与状况(用失业率、平均工资率、家庭收入、教育水平等作解释变量)。被解释变量的取值表现为两种可能:某位成年男性是劳动力(参与了劳动,设定为1),或者不是劳动力(未参与劳动,设定为0)。例2:研究选举行为,

2、即哪些因素影响居民投票的意向。则居民对某候选人或者投赞成票,或者投反对票被解释变量为分类变量的情形例3:研究哪些因素影响居民选择不同的交通工具上班:自行车、公共汽车、驾私车。例4:研究农村外出劳动力的就业选择。将外出劳动力的职业分为管理和专业技术人员、公司一般职员、从事批零业务者、服务业人员、生产工人、其它等6类,研究外出劳动力在这6类中从业的概率差异。(毕业生的去向选择)被解释变量为分类变量的情形线性模型:其中Y为二元分类变量,X为一组解释变量。对于:有:令:有:线性模型的局限问题1:的取值应为(0,1),但实

3、际上并不能保证的取值为(0,1)问题2:非正态当当两点分布问题3:异方差线性模型的局限问题4:R2通常很低:对于给定的X,Y的值或为0,或为1,即观察点或落在X轴上,或落在直线Y=1上,如图:01••••••••••••AB因而计算的R2一般很低。只有观察点十分密集于A点或B点时,R2才会较高,因为这时容易通过A、B两点的连接而将直线固定下来。线性模型的局限以投资为例:假设个体i选择投资的效用(净收益):放弃投资的效用(净收益):和取决于个体特征及两种选择各自的属性,即:实践中和是不可观察的,可观察的只有人个体选

4、择投资(Y=1)或个体放弃投资(Y=0)。但是:不可观察的对应于:Y=1不可观察的对应于:Y=0概率模型的基本思路观察:令:则有:(对于对称分布)从而:可以通过为选择一种特定的分布来推断Y=1的概率实践中两种常用的分布:逻辑(logistic)分布正态(normal)分布--------------Logit模型--------------Probit模型概率模型的基本思路一、模型形式:其中:  代表具有特征Xi的个体倾向于作出某种特别选择的程度,Pi就是个体做出某种选择的概率。也就是:Logit模型始终符合  

5、  的性质:当:当:从而克服了线性概率模型在逻辑上无法保证        的问题Logit模型二、模型估计:如果研究样本是逐个观测数据:极大似然法Logit模型二、模型估计:Logit模型二、模型估计:如果研究样本是分组数据(存在重复观察值):Ni(总观察数)ni(其中“Y=1”的观察数)XiN1n1X1N2n2X2NnnnXnpip1p2pn以各组频率pi估计Pi,从而依据μ的性质可用LS估计原模型Logit模型二、模型估计:中,Pi对X和参数均是非线性的,但可以将它线性化:将原式两边倒数再减1有:即:两边取对

6、数:事件“Y=1”发生的机会比率对数单位对数单位模型(LogitModel)Logit模型二、模型估计:分组数据的估计过程:(1)对每一观察组计算“Y=1”发生的频率pi(2)对每一观察组计算对数单位L=ln(pi/(1-pi))(3)估计随机项方差从而加权矩阵元素(4)就L与X作加权最小二乘估计要求:各组观察均满足大样本条件Logit模型三、模型检验:(1)单个回归系数的显著性检验:无论LS估计或ML估计,均可按t检验进行(2)总体线性关系的显著性检验:LS估计→F检验ML估计→LR、W、LM检验Logit模型

7、ML估计→似然比指数 :分别为所有参数为0时的对数似值和最大对数似然函数值,三、模型检验:(3)拟合优度检验:LS估计→分别为模型估计频率和实际观测频率,(k+1)为模型参数个数,s越小拟合越好Logit模型四、模型运用--解释变量对概率(被解释变量)的边际影响:在Logit模型中,为X对机会比率的对数的边际影响。X对P的边际影响:平上,其边际影响是不同的。在不同的X水Logit模型例:以Y代表一个企业在给定年份是否申请了专利,假定它与企业的年销售额X及研究发支出Z满足如下Logit模型关系:?的含义X对P的偏效

8、应、Z对P的偏效应Logit模型例1:赵耀辉:“中国农村劳动力流动及教育在其中的作用”例2:朱玲:“农地分配中的性别平等问题”Logit模型其中:一、模型形式:比较Logit模型:Probit模型依据normal分布函数Logit模型依据逻辑logistic分布函数Probits模型也始终符合     的性质:当:当:同样克服了线性概率模型在逻辑上无法保证的问题Probi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。