欢迎来到天天文库
浏览记录
ID:56039405
大小:545.88 KB
页数:19页
时间:2020-06-19
《利用MATLAB进行回归分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、利用MATLAB进行回归分析一、实验目的:1.了解回归分析的基本原理,掌握MATLAB实现的方法;2.练习用回归分析解决实际问题。二、实验内容:题目1社会学家认为犯罪与收入低、失业及人口规模有关,对20个城市的犯罪率y(每10万人中犯罪的人数)与年收入低于5000美元家庭的百分比x1、失业率x2和人口总数x3(千人)进行了调查,结果如下表。序号yx1x2x3序号yx1x2x3111.216.56.25871114.518.16.07895213.420.56.46431226.923.17.4762340.72
2、6.39.36351315.719.15.8279345.316.55.36921436.224.78.6741524.819.27.312481518.118.66.5625612.716.55.96431628.924.98.3854720.920.26.419641714.917.96.7716835.721.37.615311825.822.48.692198.717.24.97131921.720.28.4595109.614.36.47492025.716.96.73353表12.26(1)若x1~
3、x3中至多只许选择2个变量,最好的模型是什么?(2)包含3个自变量的模型比上面的模型好吗?确定最终模型。(3)对最终模型观察残差,有无异常点,若有,剔除后如何。理论分析与程序设计:为了能够有一个较直观的认识,我们可以先分别作出犯罪率xxy与年收入低于5000美元家庭的百分比1、失业率2和人口总数x3(千人)之间关系的散点图,根据大致分布粗略估计各因素造成的影响大小,再通过逐步回归法确定应该选择哪几个自变量作为模型。1/19编写程序如下:clc;clearall;y=[11.213.440.75.324.812.
4、720.935.78.79.614.526.915.736.218.128.914.925.821.725.7];%犯罪率(人/十万人)x1=[16.520.526.316.519.216.520.221.317.214.318.123.119.124.718.624.917.922.420.216.9];%低收入家庭百分比x2=[6.26.49.35.37.35.96.47.64.96.46.07.45.88.66.58.36.78.68.46.7];%失业率x3=[587643635692124864319
5、641531713749789576227937416258547169215953353];%总人口数(千人)figure(1),plot(x1,y,'*');figure(2),plot(x2,y,'*');figure(3),plot(x3,y,'*');X1=[x1',x2',x3'];stepwise(X1,y)运行结果与结论:2/19犯罪率与低收入散点图犯罪率与失业率散点图犯罪率与人口总数散点图3/19低收入与失业率作为自变量低收入与人口总数作为自变量4/19失业率与人口总数作为自变量在图中可以明显
6、看出前两图的线性程度很好,而第三个图的线性程度较差,从这个角度来说我们应该以失业率和低收入为自变量建立模型。并且我们也可以从相关性角度来选取自变量,可以看出低收入与失业率作为自变量时的RMSE=4.64848;低收入与人口总数作为自变量时的RMSE=5.62245;失业率与人口总数作为自变量时的RMSE=5.04083。我们看到当低收入与失业率作为自变量时RMSE最小,因此如果选择两个变量作为自变量的会,它们是最适合的。并且可以得到三者的关系为:y34.07251.22393x4.39894x;12对同
7、时选取三个自变量的模型分析:如果我们将其三者同时选为自变量,我们发现RMSE=4.58978,比低收入与失业率二者作为自变量时稍微小了一点,不过我们也发现此时的X3系数为0.00076937,几乎为零,是可以忽略的,因此我们仍然选取两个自变量做最终的模型。关系函数仍为:y34.07251.22393x4.39894x125/19低收入、失业率与人口总数都作为自变量残差分析:对我们设定的最终模型运用残差分析,编写程序如下:clc;clearall;y=[11.213.440.75.324.812.720.
8、935.78.79.614.526.915.736.218.128.914.925.821.725.7];%犯罪率(人/十万人)x1=[16.520.526.316.519.216.520.221.317.214.318.123.119.124.718.624.917.922.420.216.9];%低收入家庭百分比x2=[6.26.49.35.37.35.96.47.64.96.46
此文档下载收益归作者所有