欢迎来到天天文库
浏览记录
ID:44421406
大小:1.70 MB
页数:39页
时间:2019-10-21
《数据回归分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、楚雄师范学院数学建模培训题目:数据回归分析队员姓名系别专业班级1阮秀婷数学系数学与应用数学1班2陈志明数学系数学与应用数学2班3施明杰数学系信息与计算科学3班2013年8月23日归分析扌商要:木模型是为解决给定一组数据进行和关线性分析,而对应变屋与自变量之间的函数关系问题而建立的针对本文给出的多组数据多个变量样本,我们对它建立回归模型,并且利用spss,cvicws,以及matlab等数学软件对已知数据进行处理。首先用箱图进行分析,进而检测出了强影响点,得出杠杆值。其次,从回归残弟的直方图与附于图上的正态分布曲线相比较,来验证正态分布。最后,从相关系数观察
2、变量Z间是否线性相关,来检验自变量是否多重共线性。最后建立出一个合理化的模型。关键词:强影响点杠杆值回归分析相关性自相关残差异常点正态性一、问题重述yxlx2x3x4x5x644349797681520529027703166129676115921300933953692629258247481674294163202296315434141111945310560475102126171148584172028551498727112-12424001559991511174473626281912071572511799454404565841913
3、19548092756392023213627268241713453011152931113256610781028457266617106878218727660097987112826648067656213121962793826441081104465632991681884505410050111520533553556080170459615379651936306010810417827348383787111823361774125661642656058912171882833886430811010176351344465791433
4、6671345689162493883087130207648112105123512344495769725420034061355513015229229454713131236888210581209268408805561111197461828854147225上表给定了一些关于自变虽X],x2,x3,%4,x5,x6与因变量y的一些数据,请按所给的要求对给定的数据进行分析:要求:1•检测强影响点,并求出杠杆值.2.正态性检验.3.相关性检验.4.自变量的多重共线性检测,若有多重共线性,试消除,再建模.5.残差的自相关性分析,模型的合理性分析.6
5、.预测X。=(470,81,82,50,13,7,225)^时Y的预测值.二、问题分析木文是要对给定的一组数据做合理化的线性分析。先后要求对数据做异常值(强影响点)的检验和剔除,各变量的止态性检验,再从相关性的角度对各变量做相关性检验,得出数据是否适合做多元线性规划模型。为了使建立的模型具有很好的拟合效果和实际意义,又要求对各变量做相关性检验的同时进而做多重共线性的诊断,从屮发现自变量之间是否存在着多重共线性。在有多重共线性的情况下,为了消除多重共线性的影响,我们又要做剔除不合理的变量再做冋归模型。当然在做好的模型中,我们又要剔除不能通过t检验的变量,最后
6、建立没有强多重共线性,没有异常点且通过了F检验,t检验的合理化模型,再对给定的数据做出评价和预测。三•模型假设各变量的数据与所给的表格中的信息一致。并且所有数据均不是时间系列数据。四、符号说明Cook:库克距离叽:杠杆值Mahar:马氏距离五•模型的建立与求解5.1强影响点的检测,杠杆值的求解。5.1.1强影响点的检测利用SPSS数学软件对数据进行强影响点的检验。600-图表1spss箱图从所给数据绘制的箱图来看数据存在着强影响点,初步可以看出强影响点分别在兀3的3号位和12号位,兀6的34号位。为了进一步的检测出强影响点的位置和数据,减小强影响点对整体数
7、据的影响,我们进一步对强影响点进行分析。序号杠杆值叽库克距离cook:MaHar距离Maha^10.089270.001243.4813420.173340.001186.7601330.363720.0008114.1849540.081230.00933.168150.123840.000974.8297760.1075304.1938370.180450.00287.037780.272410.0003610.6238790.119720.034784.66919100.245330.000029.56781110.07050.001552.7495
8、7120.2530.091579.86694130.136160.
此文档下载收益归作者所有