资源描述:
《数据分析实验报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据分析实验报告姓名:黄晶专业班级:信计0903学号:34例2.3某科学基金会的管理人员欲了解从事研究工作的中高水平的年工资额Y与他们的研究成果(论文、著作等)的质量指标X1,从事研究工作的时间X2,以及能成功获得资助的指标X3之间的关系。为此按一定的设计方案调查了24位此类型的数学家,得数据如表2.3所示:表2.324位科学家工资额以及相关指标的调查数据序号yx1x2x3序号yx1x2x3133.23.596.11343.38.0237.6240.35.3206.41444.15.6357.0338.75.1187.
2、41542.86.6395.0446.85.8336.71633.63.7214.4541.44.2317.51734.26.275.5637.56.0135.91848.07.0407.0739.06.8256.01938.04.0356.0840.75.5304.02035.94.5233.5930.13.155.82140.45.9334.91052.97.2478.32236.85.6274.31138.24.5255.02345.24.8348.01231.84.9116.42435.13.9155.0假设误
3、差服从N(0,)分布,建立Y与X1,X2,X3之间的线性回归方程并研究相应的统计推断问题。假定某位数学家的关于X1,X2,X3的值为(x01,x02,x03)=(5.1,20,7.2),试预测他的年工资额并给出置信度为95%的置信区间。解:(spss软件)设Y与X1,X2,X3的观测值之间满足关系其中相互独立,均服从N(0,)利用spss软件得如下方差分析表、参数估计表和表方差分析表Anovab模型平方和df均方FSig.1回归629.3073209.76969.978.000a残差59.953202.998总计689
4、.26023a.预测变量:(常量),x1,x3,x2。b.因变量:y参数估计表系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)17.6251.9998.817.000x31.303.294.3104.440.000x2.323.036.6638.902.000x11.128.326.2623.461.002a.因变量:y表模型汇总b模型RR方调整R方标准估计的误差1.956a.913.9001.7314a.预测变量:(常量),x1,x3,x2。b.因变量:y由方差分析表知:P值小于,且由表知=0.91
5、3,由这些可知Y与X1,X2,X3之间的线性回归关系是显著的。由参数估计表知回归方程为。某位数学家的关于X1,X2,X3的值为(x01,x02,x03)=(5.1,20,7.2)那么预估他的年工资为:17.625+1.1285.1+0.32320+1.3037.2=39.219置信水平取,由于,利用参数估计表可得可得置信度为95%的置信区间::17.6252.0861.999=17.6254.170,即(13.455,21.795):1.1282.0860.326=1.1280.680,即(0.448,1.808):0
6、.3232.0860.036=0.3260.075,即(0.251,0.401):1.3032.0860.294=1.3030.613,即(0.690,1.916)(DASC软件)在DASC软件的A区中输入原始数据,然后在B区中设置参数,最后点击“回归分析”中的“一般多元线性回归模型的程序(带常数项)”,接着点击B区中的计算,这样就能在C区中看到计算结果,以下是C区中的简单结果:线性回归分析计算结果样本总数24自变量个数3-------------------------------------------------
7、----回归方程Y=b0+b1*X1+...+b3*X3Y=17.625+1.128X1+0.323X2+1.303X3-----------------------------------------------------残差平方和:59.9529回归平方和:629.304误差方差的估计:2.99764标准差=1.73137-----------------------------------------------------线性回归显著性检验显著性水平:0.050------------------------
8、-----------------------------回归方程整体显著性F检验,H0:b0=b1=...=b3=0-----------------------------------------------------回归系数逐一显著性t检验,H0:bi=0,i=1,...,3t临界值t(20)2.0860回归系数b0,b1