欢迎来到天天文库
浏览记录
ID:39453856
大小:553.51 KB
页数:17页
时间:2019-07-03
《Chapter9 受限因变量模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第1章受限因变量模型这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y*,y*的实际观测变量为yi。引入二元指示变量Di,如果ai2、测数据,即:当Di=1时,潜在变量与实际观测变量相等,而当Di=0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。将潜在随机变量y*的基本模型设定为:。(2)其中mi为位置参数,s为刻度参数;vi为独立于xi的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F、f。在这些假定条件下,yi*的均值为mi,方差为s2,分布函数为,概率密度函数为(证明请参见附录1)。ai3、yi*被观测到的概率为:(3)下面对截断数据模型和归并数据模型分别进行介绍1.1截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x³10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x³10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。171.1.1截断数据的分布特征如前面所述,截断数据只包括Di=1情况下的数据。截断分布是指变量高于(低于)某个设定值的未截断部分的分布。如果变量只有在高于某一门限值a时4、才被观测到(x>a),称之为从下面截断(truncationfrombelow)或者是从左边截断(truncationfromleft);如果变量只有在低于某一门限值b时才被观测到(x5、及后面的的定义均与前面相同)密度函数为:(5)从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。读者可以参阅下面介绍的几个例子。例1截断均匀分布的密度函数和分布函数如果x*在区间[a,b]上服从均匀分布(uniformdistribution),那么,(6)如果在x*=c处截断,即实际观测值x=x*,如果x*³c;x=c,如果x*6、9)yi=ai,如果yi=bi,如果其中vi~N(0,1)。即yi*~N(mi,s2),其中mi、s分布表示yi的均值和标准差。以f、F分别表示标准正态分布密度函数和分布函数。那么:(10)其中,。根据截断正态分布的密度函数公式:可直接得到时yi的密度函数:(11)根据截断正态分布的分布函数公式:17可直接得到时yi的分布函数:(12)图二截断正态分布变量的累积分布函数图(设潜变量y*~N(0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)1.截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean7、)和截断方差(truncatedvariance),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),yi的均值为:(13)其中,yi的方差为:(14)其中,。(证明请参见附录3)。例3:均匀分布的截断均值和截断方差给定模型(6),截断变量x的均值和方差分别为:17(15)例4:正态分布的截断均值和截断方差给定模型(9),那么yi的均值和方差分别为:(16)其中,yi的方差为:(17)其中,。其中,f、F分别表示正态分布的密度函数和分布函数。(1)如果ci-µ,即数据只是在右边截断,这时f(ci)=0、F(ci)=0,因此:<0(178、a)(17b)(2)如果
2、测数据,即:当Di=1时,潜在变量与实际观测变量相等,而当Di=0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。将潜在随机变量y*的基本模型设定为:。(2)其中mi为位置参数,s为刻度参数;vi为独立于xi的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F、f。在这些假定条件下,yi*的均值为mi,方差为s2,分布函数为,概率密度函数为(证明请参见附录1)。ai3、yi*被观测到的概率为:(3)下面对截断数据模型和归并数据模型分别进行介绍1.1截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x³10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x³10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。171.1.1截断数据的分布特征如前面所述,截断数据只包括Di=1情况下的数据。截断分布是指变量高于(低于)某个设定值的未截断部分的分布。如果变量只有在高于某一门限值a时4、才被观测到(x>a),称之为从下面截断(truncationfrombelow)或者是从左边截断(truncationfromleft);如果变量只有在低于某一门限值b时才被观测到(x5、及后面的的定义均与前面相同)密度函数为:(5)从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。读者可以参阅下面介绍的几个例子。例1截断均匀分布的密度函数和分布函数如果x*在区间[a,b]上服从均匀分布(uniformdistribution),那么,(6)如果在x*=c处截断,即实际观测值x=x*,如果x*³c;x=c,如果x*6、9)yi=ai,如果yi=bi,如果其中vi~N(0,1)。即yi*~N(mi,s2),其中mi、s分布表示yi的均值和标准差。以f、F分别表示标准正态分布密度函数和分布函数。那么:(10)其中,。根据截断正态分布的密度函数公式:可直接得到时yi的密度函数:(11)根据截断正态分布的分布函数公式:17可直接得到时yi的分布函数:(12)图二截断正态分布变量的累积分布函数图(设潜变量y*~N(0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)1.截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean7、)和截断方差(truncatedvariance),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),yi的均值为:(13)其中,yi的方差为:(14)其中,。(证明请参见附录3)。例3:均匀分布的截断均值和截断方差给定模型(6),截断变量x的均值和方差分别为:17(15)例4:正态分布的截断均值和截断方差给定模型(9),那么yi的均值和方差分别为:(16)其中,yi的方差为:(17)其中,。其中,f、F分别表示正态分布的密度函数和分布函数。(1)如果ci-µ,即数据只是在右边截断,这时f(ci)=0、F(ci)=0,因此:<0(178、a)(17b)(2)如果
3、yi*被观测到的概率为:(3)下面对截断数据模型和归并数据模型分别进行介绍1.1截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x³10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x³10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。171.1.1截断数据的分布特征如前面所述,截断数据只包括Di=1情况下的数据。截断分布是指变量高于(低于)某个设定值的未截断部分的分布。如果变量只有在高于某一门限值a时
4、才被观测到(x>a),称之为从下面截断(truncationfrombelow)或者是从左边截断(truncationfromleft);如果变量只有在低于某一门限值b时才被观测到(x
5、及后面的的定义均与前面相同)密度函数为:(5)从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。读者可以参阅下面介绍的几个例子。例1截断均匀分布的密度函数和分布函数如果x*在区间[a,b]上服从均匀分布(uniformdistribution),那么,(6)如果在x*=c处截断,即实际观测值x=x*,如果x*³c;x=c,如果x*6、9)yi=ai,如果yi=bi,如果其中vi~N(0,1)。即yi*~N(mi,s2),其中mi、s分布表示yi的均值和标准差。以f、F分别表示标准正态分布密度函数和分布函数。那么:(10)其中,。根据截断正态分布的密度函数公式:可直接得到时yi的密度函数:(11)根据截断正态分布的分布函数公式:17可直接得到时yi的分布函数:(12)图二截断正态分布变量的累积分布函数图(设潜变量y*~N(0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)1.截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean7、)和截断方差(truncatedvariance),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),yi的均值为:(13)其中,yi的方差为:(14)其中,。(证明请参见附录3)。例3:均匀分布的截断均值和截断方差给定模型(6),截断变量x的均值和方差分别为:17(15)例4:正态分布的截断均值和截断方差给定模型(9),那么yi的均值和方差分别为:(16)其中,yi的方差为:(17)其中,。其中,f、F分别表示正态分布的密度函数和分布函数。(1)如果ci-µ,即数据只是在右边截断,这时f(ci)=0、F(ci)=0,因此:<0(178、a)(17b)(2)如果
6、9)yi=ai,如果yi=bi,如果其中vi~N(0,1)。即yi*~N(mi,s2),其中mi、s分布表示yi的均值和标准差。以f、F分别表示标准正态分布密度函数和分布函数。那么:(10)其中,。根据截断正态分布的密度函数公式:可直接得到时yi的密度函数:(11)根据截断正态分布的分布函数公式:17可直接得到时yi的分布函数:(12)图二截断正态分布变量的累积分布函数图(设潜变量y*~N(0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)1.截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean
7、)和截断方差(truncatedvariance),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),yi的均值为:(13)其中,yi的方差为:(14)其中,。(证明请参见附录3)。例3:均匀分布的截断均值和截断方差给定模型(6),截断变量x的均值和方差分别为:17(15)例4:正态分布的截断均值和截断方差给定模型(9),那么yi的均值和方差分别为:(16)其中,yi的方差为:(17)其中,。其中,f、F分别表示正态分布的密度函数和分布函数。(1)如果ci-µ,即数据只是在右边截断,这时f(ci)=0、F(ci)=0,因此:<0(17
8、a)(17b)(2)如果
此文档下载收益归作者所有