欢迎来到天天文库
浏览记录
ID:37551474
大小:251.26 KB
页数:13页
时间:2019-05-11
《含虚拟自变量的回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1统计学上的定义和计算公式含虚拟自变量的回归分析定义:前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数量变量、定量变量或数量因素。然而,在实际问题的研究中,经常会碰到一些非数量型的变量,如性别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量。在建立一个实际问题的回归方程时,经常需要考虑这些定性变量。例如,建立粮食产量预测方程就应考虑到正常年份与受灾年份的不同影响;建立空调的销售模型时,除了要考虑居民收入和商品价格这两个量的因素之外,
2、还必须将“季节”这个质的因素,作为一个重要解释变量。由于受到质的因素影响,回归模型的参数不再是固定不变的。例如,在空调销售模型中,收入、价格与空调销售额的关系是随着季节变化而改变的,也就是说,在不同的季节回归模型的参数也会有所不同。再如,我国居民的消费行为在改革开放前后大不相同,因此消费函数的参数也会发生变化。显然,如果忽略质的因素,仍把模型中的参数看作是固定不变的,得到的参数估计量就不能正确描述经济变量之间的关系。在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取“0”和“1”两个值的0−1型虚拟自变量。当某一属性出现时,虚拟
3、变量取值为“1”,否则取值为“0”。例如,令“1”表示改革开放以后的时期,“0”则表示改革开放以前的时期。再如,用“l”表示某人是男性,“0”则表示某人是女性。虚拟变量也称为哑变量。需要指出的是,虽然虚拟变量取某一数值,但这一数值没有任何数量大小的意义,它仅仅用来说明观察单位的性质和属性。如果在回归模型中需要引入多个0−1型虚拟变量D时,虚拟变量的个数应按下列原则来确定:对于包含一个具有k种特征或状态的质因素的回归模型,如果回归模型不带常数项,则中需引入k个0−1型虚拟变量D;如果有常数项,则只需引入k−1个0−1型虚拟变量D。当k=2时,只需要引入一
4、个0−1型虚拟变量D。计算公式如下。下面以自变量所含定性变量是一个还是多个来分别说明如何构造含虚拟自变量的回归模型。(1)自变量中只含一个定性变量,且这个定性变量只有两种特征的简单情况时。(2)自变量中含多个定性变量时。研究问题研究采取某项保险革新措施的速度y与保险公司的规模x1及其类型d之间的关系,数据如表7-6所示。2SPSS中实现过程表7-6保险公司革新情况iyx1d117151022692032117504303105221040602770712210081912009429001016238011281641121527211311295
5、1143868115318511621224117201661181330511930124120142461实现步骤图7-23“LinearRegression”对话框(三)(1)第一部分输出结果文件中的第一个表格如下表所示。3结果和讨论(2)输出的结果文件中第二个表格如下表所示。(3)输出的结果文件中第三个表格如下表所示。(4)输出的结果文件中第四个表格如下表所示。
此文档下载收益归作者所有