线性回归分析方法

线性回归分析方法

ID:10948136

大小:342.00 KB

页数:10页

时间:2018-07-09

线性回归分析方法_第1页
线性回归分析方法_第2页
线性回归分析方法_第3页
线性回归分析方法_第4页
线性回归分析方法_第5页
资源描述:

《线性回归分析方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、9-1实验报告一、实验内容与目的利用线性回归分析方法分析研究高等院校人文社会科学研究中立项课题数受哪些因素影响,并建立回归模型。这里收集了某年31个省市自治区部分高校有关社会科学研究方面的数据,其中,被解释变量为立项课题数,解释变量为投入人年数、投入高级职称的人年数、投入科研事业费、专著数、论文数、获奖数,分别采用了强制进入策略和向后筛选策略。二、操作过程(包含的主要内容①数据文件的建立②分析前数据的预处理③统计分析运用方法操作)数据文件的建立:将“课题总数”,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”设为标准型变量,定计量尺度

2、为定距型数据。1analyze-regression-linear2将“课题总数”选入dependent,“投入人年数”“投入高级职称的人年数”“投入科研事业费”“专著数”“论文数”“获奖数”选入independent3打开method的下拉框选择一选择enter,点statistics勾选estimatesmodelfitcollinearitydiagnostics(可以得到图1至图4)选择二选择backward,点statistics勾选“estimates”“modelfit”“rsquaredchange”“descriptives”“Collinearity”

3、点save在predicted框中勾选“standardized”“adjusted”“s.e.ofmeanpredictions”点save在residuals框中勾选“standardized”“studentized”“studentizeddeleted”点save在influence框中勾选“dfbeta(s)”“dffit”“covariance”(可以得到图5至图8)4点击plots按钮,将“zresid”选入y,将“zpred”选入x,勾选nomalprobabilityplot(可以得到图10和图12)5analyze-nonparametric-1-s

4、amplek-ctests6将standardizedresidual选入testvariablelist,选择testdistribution框中的nomal(可以得到图9)7analyze-correlate-bivariate8standardizedresidual和standardizedpredicted选入variable再勾选speamam(可以得到图11)三、结论与分析(对输出结果进行解释说明)从图1可以看出,进行拟合优度检验,R2=0.969,由于方程有多个解释变量,可参考可调整的判定系数,可调整的判定系数为0.924,比较接近1,因此认为拟合优度较高

5、,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。10从图2可以看出,表二显示了被解释变量的变差来源、自由度、方差和离差平方和等,可以看出,被解释变量的总离差平方和为2.1×107,回归平方和及方差分别为2×107和3298385.48,剩余平方和及方差分别为1286497和53604.047,F检验统计量的观测值为61.532,对应的概率P-值接近0。依据该表可进行回归方程的显著性检验,如果显著性水平为0.05,由于P-值小于显著性水平,应拒绝回归方程显著性的原假设,认为各回归系数不同时为0,被解释变量和解释变量全体的线性关系是显著的,可以建立线性回归模型。从

6、图3可以看出,图3显示了偏回归系数、偏回归系数的标准差、标准化偏回归系数、t检验的统计值和方程的膨胀因子等。依据该表可以进行回归系数的显著性检验,可以看到:如果显著性水平α为0.05,除投入人年数以外,其他变量的回归系数显著性t检验的概率P-值都大于显著性水平α,因此不应该拒绝原假设,认为这些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。由于模型中保留了一些不该保留的变量,因此该模型目前是不可用的,应该重新建立模型。同时,从容忍度和膨胀因子来看,投入高级职称的人年数与其他解释变量的多重共线性很严重,在重新建立模型时可以考虑删除该变量

7、。从图4可以看出,图4显示了特征值、条件指数、各特征值解释各解释变量的方差比。依据该表可进行多重共线性检验。从方差比来看,第七个特征值既能解释投入人年数方差的84%,也可以解释投入高级职称的人年数方差的98%,同时还可以解释专著数方差的44%,因此有理由认为,这些变量间存在多重共线性。从条件指数来看,第5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。从图5可以看出,利用向后筛选策略共经过六步完成回归方程的建立,最终模型为第六个模型。从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度也逐步下降。这一方面说

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。