线性回归分析和方差分析报告

线性回归分析和方差分析报告

ID:32171583

大小:238.36 KB

页数:8页

时间:2019-02-01

线性回归分析和方差分析报告_第1页
线性回归分析和方差分析报告_第2页
线性回归分析和方差分析报告_第3页
线性回归分析和方差分析报告_第4页
线性回归分析和方差分析报告_第5页
资源描述:

《线性回归分析和方差分析报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、线性回归分析和方差分析报告信计12徐文豪2110902039本报告以教材第二章课后习题2.4和第三章课后习题3.6为主体,给出对应的解答、sas代码和结果分析。2.4某公司管理人员为了了解某化妆品在一个城市的月销售量(单位:箱)与该城市中适合使用该化妆品的人数(单位:前人)以及他们人均月收入(单位:元)之间的关系,在某个月中对15个城市做了调查,得上述各量的观测值如下表所示:16227424501201803254223375380213120528386786234716926537828198300819233024501161952137555

2、3256025243040202323724427144236266010315720882123702605假设与,之间满足线性回归关系,其中独立通分布于。(1)求回归系数的最小二乘估计和误差方差的估计,写出回归方程并对回归系数作解释。解:首先将数据导入sas,sas语句如下:datasale;inputyx1x2;cards;1622742450120180325422337538021312052838678623471692653782819830081923302450116195213755532560252430402023237244

3、27144236266010315720882123702605;run;然后调用reg过程,sas语句如下:procregdata=sale;modely=x1x2;run;运行结果如下:由此得到的最小二乘估计分别为3.45261,0.496,0.0092,,回归方程为显示当人均月收入固定时,使用化妆品的人数上升一人,月销售量增加0.496个单位;显示当使用化妆品的人数固定时,人均月收入增加一元,月销售量增加0.0092个单位。(2)求出方差分析表,解释对线性回归关系显著性检验的结果,求复相关系数的平方的值并解释其意义。解:由(1)的结果,方差分析

4、表如下:由结果可知,线性回归关系显著性检验的值小于0.001,则有线性回归关系显著。该sas语句同时也得到了复相关系数的值为0.9989,由于越大,线性函数值占的比率越大,即与的线性关系越显著,因而结果显示月销售量与使用化妆品的人数及人均月收入有明显的线性关系。(3)分别求出和置信度为95%的置信区间。解:由公式,,要求出和的置信区间,首先应该求出,使用tinv函数,sas语句如下:dataget_p;y=tinv(0.975,12);run;procprintdata=get_p;run;得到。又由(1)的结果得到参数估计表如下:综合得到:对:,即

5、置信区间为。对:,即置信区间为。(4)对,分别检验人数及收入对销量的影响是否显著,利用与回归系数有关的一般假设检验方法检验和的交互作用(即)对的影响是否显著。解:由(3)得到的参数估计表得到假设和检验的值均小于0.0001,因而和对的影响显著。为检验和的交叉项对的影响,先构造全模型:利用观测数据拟合该模型得到,又由(2)得到的方差分析表得到,由此得到检验统计量的观测值为检验值为远大于一般显著性水平,因此认为,的交叉项对的影响是不显著的,即模型中没有必要引入交叉项。(5)该公司欲在一个适宜使用该化妆品的人数,人均月收入的新的城市中销售该化妆品,求其销量

6、的预测值及其置信度为95%的置信区间。解:点估计可直接根据回归方程给出,得到估计值。而置信度为0.95的置信区间为其中,,,为设计矩阵,解得置信区间为(128.7703,141.7749)。(6)求的拟合值,残差及学生化残差。根据学生化残差正态性的频率检验及正态QQ图检验说明模型误差项的正态性假定是否合理,有序学生化残差与相应标准正态分布的分位数的相关系数是多少?做出各种残差图,分析模型有关假定的合理性。解:根据回归方程,可直接得到的拟合值,结果如下:在reg过程中由sas语句modely=x1x2/r得到残差和学生化残差,结果如下:做频率检验得到,

7、学生化残差中有在区间(-1,1)内,有在区间(-1.5,1.5)内,有在区间(-2,2)内,由此可见学生化残差落在上述各区间的频率与分布的相应概率相差均不大,因此对所给数据没有理由拒绝模型误差服从正态分布的假定。为进行正态QQ图检验,调用capability过程,得到结果如下:从上图可以看出,点大致在一条直线上,又调用corr过程得到相关系数为0.99363,非常接近1,由此我们认为模型中误差项正态分布的假定是非常合理的。以因变量为横坐标的残差图如下图所示:以自变量为横坐标的残差图如下图所示:以自变量为横坐标的残差图如下图所示:时序残差图如下图所示:

8、以上四个残差图,绘点均在大致在一带状区域内且不呈现任何明显的趋势,再一次说明了模型中误差项正态分布的假定是非

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。