资源描述:
《SPSS的多元统计分析算法研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、SPSS的多元统计分析算法研究第一章多元线性回归分析1.1研究背景消费是宏观经济必不可少的环节,完善的消费模型可以为宏观调控提供重要的依据。根据不同的理论可以建立不同的消费函数模型,而国内的许多学者研究的主要是消费支出与收入的单变量之间的函数关系,由于忽略了对消费支出有显著影响的变量,其所建立的方程必与实际有较大的偏离。本文综合考察影响消费的主要因素,如收入水平、价格、恩格尔系数、居住面积等,采用进入逐步、向前、向后、删除、岭回归方法,对消费支出的多元线性回归模型进行研究,找出能较准确描述客观实际结果的最优模
2、型。1.2问题提出与描述、数据收集按照经济学理论,决定居民消费支出变动的因素主要有收入水平、居民消费意愿、消费环境等。为了符合我国经济发展的不平衡性的现状,本文主要研究农村居民的消费支出模型。文中取因变量Y为农村居民年人均生活消费支出(单位:元),自变量为农村居民人均纯收入X1(单位:元)、商品零售价格定基指数X2(1978年的为100)、消费价格定基指数X3(1978年的为100)、家庭恩格尔系数X4(%)、人均住宅建筑面积X5(单位:m2)。本文取1900年至2009年的数据(数据来源:中华人民共和国国家
3、统计局网公布的1996至2010年中国统计年鉴)列于附录的表一中。1.3模型建立1.3.1理论背景多元线性回归模型如下:Y表示因变量,Xi(i=1,…,p)表示自变量,ε表示随机误差项。对于n组观测值,其方程组形式为即14模型假设:⑴零均值假设:i=1,2,…,n⑵同方差:⑶无自相关:⑷误差与自变量不相关:i=1,2,…,n,k=0,1,…,p⑸自变量之间无多重共线性1.3.2模型建立及SPSS运算结果分析假设因变量Y(农村居民年人均生活消费支出)与自变量X1(农村居民人均纯收入)、X2(商品零售价格定基指数
4、)、X3(消费价格定基指数)、X4(家庭恩格尔系数)、X5(人均住宅建筑面积)满足下述等式:强行回归:在SPSS中进行强行回归,会得到如下表格:⑴输入变量从表1-1中可以看到,本文先强行将五个自变量与因变量进行线性拟合,希望得到一个线性函数。14表1-1输入的变量输入/移去的变量模型输入的变量移去的变量方法1X5,X2,X4,X1,X3a.输入a.已输入所有请求的变量。描述性统计量均值标准偏差NY1847.2585983.0383720X12391.8901292.887420X2335.25559.9815
5、20X3298.05069.430020X450.9526.340720X524.9434.876220⑵拟合优度检验表1-2拟合优度检验模型汇总b模型RR方调整R方标准估计的误差更改统计量Durbin-WatsonR方更改F更改df1df2Sig.F更改1.999a.998.99756.89386.9981131.672514.0001.197a.预测变量:(常量),X5,X2,X4,X1,X3。b.因变量:Y表1-2是对回归方程的拟合优度检验的说明样本决定系数,说明自变量可以解释因变量99.8%的变化,而
6、调整后的样本决定系数,这两个值非常接近1,所以拟合程度比较高。⑶方程显著性检验14表1-3方程显著性检验Anovab模型平方和df均方FSig.1回归1.832E753663121.5341131.672.000a残差45316.766143236.912总计1.836E719a.预测变量:(常量),X5,X2,X4,X1,X3。b.因变量:Y表1-3是对回归方程显著性检验的说明统计量,对应的概率值,说明回归方程显著成立(我们给定显著水平为0.05)。⑷参数求解及其显著性检验表1-4参数求解及显著性检验系数a
7、模型非标准化系数标准系数tSig.相关性共线性统计量B标准误差试用版零阶偏部分容差VIF1(常量)-1457.646936.744-1.556.142X1.836.0651.10012.808.000.998.960.170.02441.819X23.4173.837.209.891.388.755.232.012.003310.892X3-5.2934.780-.374-1.107.287.888-.284-.015.002646.608X416.65711.904.1071.399.184-.896.35
8、0.019.03033.443X535.61124.308.1771.465.165.969.365.019.01282.463a.因变量:Y表1-4是对参数的求解及显著性检验的说明我们可以从上表看出系数向量的估计值,其中,,,,,14则拟合的回归方程为另外,由上表中的t检验(我们给定显著水平为0.10)知:只有自变量X1(其对应的概率p=0.000)与因变量Y在总体上存在比较显著的线性关系,其余自