欢迎来到天天文库
浏览记录
ID:57297254
大小:1.04 MB
页数:93页
时间:2020-08-10
《离散计数数据模型课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§4.3离散计数模型(Countdatamodels)离散计数模型的提出计数事件的概率模型泊松回归模型离散计数模型的扩展一、离散计数模型的提出1、经济社会研究中的离散计数问题计数变量是取值为非负整数的变量许多经济、社会问题的描述变量都为计数变量一定时间内发生事故的次数一年中公司申请的专利数量一定时间内变换工作的次数一定时间内到医院就诊的次数家庭生育孩子的数量学生在本科4年中不及格课程门数以这些变量为被解释变量,研究它们的影响因素,构成了计量经济学的一类问题。2、计量经济学中的离散计数数据模型假设y是计数变量,x是一组解释变量常见的
2、建模方法是选用线性模型,用OLS进行回归由于,应该对所有x都非负,矛盾。选用自然对数变换在计数数据应用中难以实现,因为相当比例的y取值为0。当y没有上界时,最常用的模型是指数函数非线性最小二乘方法(NLS)可以用于估计离散计数模型,但效果不理想NLS估计量是无效的,除非是常数所有计数数据的标准分布都意味着异方差因此,非负整数和异方差特征决定,有必要引进描述非负整数特征的概率分布分析离散计数模型。七十年代末以来,许多学者在计数数据模型的处理方法方面作出了较大贡献,包括:Gilbert(1979)提出了泊松回归模型,Hausman,H
3、all和Griliches(1984)提出了负二项回归模型和Panel方法,Gourier,Monfort和Trogonon(1984)提出了仿最大似然法。其中,最先提出的泊松方法在研究计数数据模型问题中应用得非常广泛。二、计数事件的概率模型1、计数过程计数过程的定义随机过程被称为计数过程,如果N(t)表示t时间前发生的事件总量平稳性(Stationary)在任何时间区间上,事件发生数量的分布只由时间区间的长度决定2、单变量泊松过程在时间区间上,事件发生1次的概率与t时间前事件发生的数量无关在时间区间上,事件发生1次和0次的概率分
4、别为其中,可以看出,在一个足够短的区间上,事件发生两次以上的概率趋近于0使用初始条件求解以上微分方程利用概率生成函数得到泊松分布3、泊松分布(Poissondistribution)在泊松过程中,标准化时间区间长度为t=1,则可以得到参数为的标准泊松分布泊松分布的一个重要特征是均值和方差相等,称为equidispersion。如果方差大于均值,称为overdispersion;如果方差小于均值,称为underdispersion。定理令,。当且仅当X与Y独立时,随机变量Z=X+Y是泊松分布。当X与Y独立时,Z的概率生成函数为则Z服
5、从泊松分布,参数为4、二项分布(Binomialdistribution)随机变量X服从参数为n和p的二项分布,0
6、率较高。7、Katz分布族非负整数分布可以用递归概率比表示Katz分布族定义为其中,,且当,当,分布为泊松分布当,分布为二项分布当,分布为负二项分布当,分布为对数分布三、泊松回归模型1、泊松回归模型(Poissonregressionmodel)假设1:假设2:假设3:独立同分布从模型假设可以发现:非负整数特征取值为0的概率不可忽略可以预测事件发生概率不对称分布(skeweddistribution)异方差2、极大似然估计(MLE)对数似然函数最大化似然函数,一阶条件:Hessian矩阵:由于Hessian矩阵是负定的,对数似然函
7、数是凹函数,估计值的二阶条件满足利用迭代算法,可以求解一阶条件例如,Newton-Raphson方法g(.)是梯度向量3、例题:本科不及格门数的原因分析变量Unpass—不及格门数Score—高考成绩Stime—平均每周于用学习的时间Dsa—理、文科虚变量Dbody—健康状况虚变量数据数据经典模型(OLS)Poisson回归模型多余变量检验剔除不显著变量例题☆轮船事故次数(accidents)与轮船型号(typea、b、c、d、e)、制造年份(year60、65、70、75)、投入使用年份(yearop60、75)和实际服务时间(
8、servmonth)的关系研究。样本:34注意入选的解释变量部分参数的经济意义缺乏合理解释。只作为试例。ACCIDENTS=@EXP(1.645572184*TYPEA+2.353413299*TYPEB+0.4488787812*TYPEC+0.
此文档下载收益归作者所有