欢迎来到天天文库
浏览记录
ID:2001878
大小:162.89 KB
页数:6页
时间:2017-11-14
《spss回归分析作业》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、统计与数据挖掘实验学生姓名:学号:学院:经济与管理学院指导老师:专业:日期:2016/1/19数据挖掘——回归分析一.回归分析概述回归分析是一种应用极为广泛的数量分析方法。它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,帮助人们准确把握变量受其他一个或多个变量影响的程度,进而为预测提供科学依据。二.回归分析一般步骤1.确定回归方程中解释变量和被解释变量2.确定回归模型3.建立回归方程4.对回归方程进行各种检验5.利用回归方程进行预测三.回归分析例题为研究高等院校人文社会科学研究中立项课题数受哪些因
2、素的影响,收集某年31个省市自治区部分高校有关社科研究方面的数据,并利用线性回归分析方法进行分析。这里,被解释变量为立项课题总数,解释变量为投入总人数、投入高级职称的人数、投入科研事业费,专著数,论文数、获奖数。1.数据结构定义:A先在spss变量窗口对数据结构进行定义,并相应的定义标签定义结果如下。B紧接着在spss数据编辑窗口进行相应的数据录入。(共31组数据)2.用spss进行回归分析A.选择菜单:分析-回归-线性。B.选择观测变量到因变量列表和因子框中。控制变量有几个不同的取值就表示控制变量有几个水平。C.分析结果如下由于该方程中有多个解释变
3、量,因此,应参考调整系数的判定系数,为0.924,较接近1,因此,认为拟合优度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。F检验统计量的观测值为61.532,对应的概率P值近似为0.小于显著性水平a,应拒绝回归方程显著性检验的原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著地,可建立线性模型。如果显著性水平a为0.05,除投入人数以外,其他变量的回归系数显著性t检验的概率P-值都大于显著性水平a,因此不应拒绝原假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中
4、。由于该模型中保留了一些不应保留的变量,因此该模型目前是不可用的,应重新建模。同时,从容忍度和方差膨胀因子看,投入高级职称的人数与其他解释变量的多重共线性很严重,在重新建模时可考虑剔除该变量。依据该表可进行多重共线性检测。从方差比来看,第7个特征值既能解释投入人数方差的84%,也可解释投入高级职称的人数方差的98%,同时还可解释专著数方差的44%,因此有理由认为这些变量间存在多重共线性;从条件指数来看,第5,6,7个条件指数都大于10,说明变量间确实存在多重共线性。
此文档下载收益归作者所有