欢迎来到天天文库
浏览记录
ID:50616440
大小:633.00 KB
页数:50页
时间:2020-03-12
《虚拟变量和分布滞后.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、3.4虚拟变量一、虚拟变量及其作用二、虚拟变量的设定三、虚拟变量的特殊应用一、虚拟变量(dummy)及其作用1、定义:数值只取0和1的人工变量。用符号D来表示。如2、作用:⑴可以描述和测量定性因素的影响。⑵便于处理异常数据。一是直接剔除;二是修匀;三是设置虚拟变量。城镇居民农村居民政策紧缩政策宽松异常时期正常时期二、虚拟变量的设定1.虚拟变量的引入方式(1)加法方式(2)乘法方式(3)一般方式2.虚拟变量的设置原则(1)一个因素两个类型(2)一个因素多个类型(3)多个因素各两种类型二、虚拟变量的设定1.虚拟变量的引入方式(1)加法方式---影响截距家庭教育费用支出函数Yi=a+bxi+αDi
2、+εi虚拟变量:上式等价为:无适龄子女支出函数(Di=0):Yi=a+bxi+εi有适龄子女支出函数(Di=1):Yi=(a+α)+bxi+εi有适龄子女无适龄子女加法方式引入虚拟变量,反映定性因素对截距的影响D=0D=1aa+αα二、虚拟变量的设定(2)乘法方式------影响斜率Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=a+(b+β)xi+εi二、虚拟变量的设定乘法方式引入虚拟变量,可反映定性因素对斜率的影响D=0D=1aβ(3)一般方式同时引入加法与乘法方式。再利用t检验判断α、β是否显著的不等于零。进
3、而确定虚拟变量的具体引入方式。SCATXY绘制相关图例7.表列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。前3个和后5个差异大。反映“收入层次”这一定性因素的影响,设置虚拟变量:中高收入家庭低收入家庭同时引入加法和乘法方法,再进行t检验。彩电需求函数设成:Yi=a+bxi+αDi+βXDi+εiDATAD1GENRXD=X*D1LSYCXD1XD我国城镇居民彩电需求函数的估计结果为:对应的t统计量值α、β的t检验都是显著的,故影响截距和斜率。各自的需求函数为(略):对应的t统计量值2.虚拟变量的设置原则⑴一个因素多个类型一个因素m个不同类型,应设m-1个虚拟变量。例:设公
4、司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素的影响,应该设置两个虚拟变量:而将年薪模型取成(假设以加法方式引入):Yi=a+bxi+α1D1i+α2D2i+εi本科其他研究生其他其等价于:Yi=a+bxi+εi大专以下(D1=D2=0)Yi=(a+α1)+bxi+εi本科(D1=1,D2=0)Yi=(a+α2)+bxi+εi研究生(D1=0,D2=1)通过检验、α1、α2的显著性,可以判断学历层次对职员的年薪是否有显著影响。大专以下本科研究生工龄年薪α2-α1α1(2)多个因素各两种类型如果有m个定性因素,且每个因素各有两个不同的属性类
5、型,则引入m个虚拟变量。例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成:Yi=a+bxi+α1D1i+α2D2i+εi其中y,x分别是居民住房消费支出和可支配收入,虚拟变量这样可以反映各类居民家庭的住房消费情况:农村居民城镇居民高收入家庭低收入家庭城市低收入家庭(D1=0,D2=0)Yi=a+bxi+εi城市高收入家庭(D1=0,D2=1)Yi=(a+α2)+bxi+εi农村低收入家庭(D1=1,D2=0)Yi=(a+α1)+bxi+εi农村高收入家庭(D1=1,D2=1)Yi=(a+α1+α2)+bxi+εi推广到更一般的情况,如果有些因素有多个属性水
6、平,则参照“一个因素多种类型”的设置原则来设置虚拟变量。三、虚拟变量的特殊应用1、调整季节波动2、检验模型结构的稳定性3、分段回归4、混合回归三、虚拟变量的特殊应用1、调整季节波动例如,利用季度数据分析某公司利润y与销售收入x关系时,考虑季节性影响,引入三个虚拟变量(设第1季度为基础类型):取利润函数为:Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi则a、α1、α2、α3分别反映了一、二、三、四季度对利润的影响,据t检验判断季节因素对利润是否显著影响。第i+1季度i=1,2,3其他季度2、检验模型结构的稳定性设根据两个样本估计的回归模型分别为:样本1:Yi=a1+b1xi+εi样
7、本2:Yi=a2+b2xi+εi设置虚拟变量:估计以下模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi样本2样本1利用t检验判断D、XD系数的显著性,可以得到四种检验结果:(1)两个系数均等于零,即a2=a1,b2=b1,表明两个回归模型之间没有显著差异,称之为“重合回归”。(2)D的系数不等于零,XD的系数等于零,即a2≠a1,b2=b1。称之为“平行回归”。(3)D的系数等于零,
此文档下载收益归作者所有