数学实验——回归分析

数学实验——回归分析

ID:15321017

大小:695.92 KB

页数:19页

时间:2018-08-02

数学实验——回归分析_第1页
数学实验——回归分析_第2页
数学实验——回归分析_第3页
数学实验——回归分析_第4页
数学实验——回归分析_第5页
资源描述:

《数学实验——回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数学实验报告实验10回归分析实验10回归分析分1黄浩2011011743一、实验目的1.了解回归分析的基本原理,掌握MATLAB实现的方法2.练习用回归分析解决实际问题二、实验内容1.《数学实验》第一版(问题2)问题叙述:电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表)。建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.0实验过程:本题是一个二元

2、回归问题,为了了解数据点的整体特性(线性、非线性),我们先对上述数据点做3维的散点图。使用代码:y=[9690959295959494];x1=[1.52.01.52.53.32.34.22.5];x2=[5.02.04.02.53.03.52.53.0];plot3(x1,x2,y,'+');grid经过旋转,找到了一个近似平面的位置:19数学实验报告实验10回归分析这说明两种广告费用都有可能分别独立地对每周收入有线性的关系,因此,不妨设y为每周收入,x1为电视广告费用,x2为报纸广告费用,建立二元线性回归的模型:y=β0+β1x

3、1+β2x2使用代码:y=[9690959295959494];x1=[1.52.01.52.53.32.34.22.5];x2=[5.02.04.02.53.03.52.53.0];n=8;X=[ones(n,1)x1'x2'];[bbintrrints]=regress(y',X);b,bint,s,rcoplot(r,rint)所得结果整理为:回归系数估计值置信区间β083.211678.805887.6174β11.29850.40072.1962β22.33721.48603.1883R2Fps20.908924.9408

4、0.00250.4897因此,回归得到的公式为:19数学实验报告实验10回归分析y=83.2116+1.2985x1+2.3372x2因为三个回归系数的置信区间都不含零点,因此关于三个回归系数的原假设H0:βi=0都被推翻;而且因F(1,n-2)分布大于F值的概率p<0.05,说明上述模型在整体上是有效的。同时,观察最后一行的其他数据,我们看到R2和F的数值都比较大,与刚才的假设检验是互相吻合的。同时,我们再看一下输出的残差和置信区间图:我们看到,第一个点的残差置信区间不含零点,而又因残差应服从均值为0的正态分布,因而我们认为该点是

5、异常的,是离群点,应予以剔除。使用剔除离群点后的数据重新进行回归分析(代码省略),结果如下:回归系数估计值置信区间β081.488178.787884.1883β11.28770.79641.7790β22.97662.32813.6250R2Fps20.976884.38420.00050.125719数学实验报告实验10回归分析从上表可见,当剔除离群点后,R2和F值都增大了,而且p和s2都减小了,这都说明,剔除离群点使得线性回归的精度得以提高,此时:y=81.4881+1.2877x1+2.9766x2而且,输出的残差和置信区间

6、图如下所示:此时,离群点已经完全剔除,残差与正态分布基本吻合。(以下的讨论是一个不成功的尝试):进一步考虑,在实际生活中,电视广告和报纸广告是相辅相成的,两种媒介同时起作用时,可能会带来一些附加收益,即可能存在x1与x2的交互项。因为本题的数据点很少,难以进行书中的残差分析,因而我们直接使用二元二项式回归,以期找到更合适的拟合公式,使用代码(暂时保留了刚才找到的离群点):y=[9690959295959494];x1=[1.52.01.52.53.32.34.22.5];x2=[5.02.04.02.53.03.52.53.0];x

7、=[x1',x2'];rstool(x,y');得到了一个交互式画面:19数学实验报告实验10回归分析然后,对该交互式画面提供的四种模型分别输出回归系数和剩余标准差,整理如下:β0β1β2β3β4β5Slinear83.21161.29852.3372------0.6998purequadratic76.30191.52806.6454-0.0779-0.6252--0.2496interaction88.8128-2.04170.29861.2280----0.4527Fullquadratic85.4135-3.08213.8

8、8690.93400.2830-0.47490.1415由剩余标准差的比较可知,使用包含线性项和完全二次项的模型可以获得最小的剩余标准差,即数据的拟合更为精确。但同时,我们发现,这种模型下β3、β4、β5的值都远远小于β1、β2,这说

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。