资源描述:
《MATLAB多元回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、概述根据图形(实际点),选配一条恰当的函数形式(类型)---需要数学理论与基础和经验。(并写出该函数表达式的一般形式,含待定系数)------选用某条回归命令求出所有的待定系数。所以可以说,回归就是求待定系数的过程(需确定函数的形式)1、[b,bint,r,rint,s]=regress(y,X,alpha)或者regress(y,x)输入y:因变量(列向量)X:自变量组成的矩阵,并且x要在最前面额外添加全1列/对应于常数项alpha:显著性水平(缺省时定位0.05,即置信水平95%,alpha不影响b
2、,只影响bint(区间估计)。它越小,即置信度越高,则bint范围越大。显著水平越高,则区间就越小)输出:b:多元线性回归方程的各个系数(含常数项,第一项为常数项)bint:b的置信区间(回归系数的区间估计)r:残差(列向量)rint:r的置信区间stats:用于检验回归模型的统计量,有四个数值:相关系数r2、F值、与F对应的概率p和残差的方差(前两个越大越好,后两个越小越好)2、rcplot(r.rint)残差分析,作残差图如下图:matlab多元线性回归每条线长度表示的是置信区间,小圆圈代
3、表残差点。残差图中红色线条表示异常点,应剔除再次进行绘图从残差图可以看出,除第二个和第十个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型能较好的符合原始数据,而这两个数据可视为异常点(而剔除)3、实例分析如线性回归模型y=b0+b1X1+b2X2+b3X3+e回归系数b0-b3,由数据估计,e是随机误差y=b0+b1X1+b2X2+b3X3+b4X4+b5X5+b6X6+e1y=[1442151381451621421701241581541621501401101281
4、30135114116124136142120120160158144130125175];x1=[394745476546674267566456593442484518201936503921445363292569];x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628.322.025.327.4];x3=[010110101010
5、0001000...00100110101];X=[ones(16,1),x1',x2',x3'];%ones(16,1)添加常数列[b,bint,r,rint,stats]=regress(y',X);b,bint,statsrcoplot(r,rint)4、检验怎么对多元线性回归模型的回归系数β做t检验和F检验?进行多元线性回归统计数F,t测验的小程序:clear,clcx=rand(50,10);y=rand(50,1);%example[n,k]=size(x);X=[ones(n,1),x];
6、%构建结构阵X,A=X'*X;%求算信息阵A,C=inv(A);%求算信息阵的逆阵,b=Xy,%求算回归统计数向量,其中第一行为回归截距a,RSS=y'*y-b'*X'*y,%求算离回归平方和,MSe=RSS/(n-k-1),%求算离回归方差,Up=b.*b./diag(C);%求算偏回归平方和,其中第一行是a与0差异的偏平方和,F=Up/MSe,%F测验,其中第一行为a与0差异的F值,sb=sqrt(MSe*diag(C));%求算回归统计数标准误,t=b./sb,%回归统计数的t测验,其中第一行为
7、a与0差异的t测验值。[t,t.^2,F],%验证t^2=FSSy=var(y)*(n-1)R2=(SSy-RSS)/SSy注:r^2(决定系数)越大(接近于1),它们之间的关系越密切,拟合的效果越好。当然,对于复杂的多变数非线性关系的分析,统计上应以离回归方差(MSe)最小为佳。MSe=RSS/(n-k-1),RSS为离回归平方和,n为观察值组数,k为模型的效应项数(不包括常数项)。部分摘自网络1.多元线性回归在Matlab统计工具箱中使用命令regress()实现多元线性回归,调用格式为b=regr
8、ess(y,x)或[b,bint,r,rint,statsl=regess(y,x,alpha)其中因变量数据向量y和自变量数据矩阵x按以下排列方式输入对一元线性回归,取k=1即可。alpha为显著性水平(缺省时设定为0.05),输出向量b,bint为回归系数估计值和它们的置信区间,r,rint为残差及其置信区间,stats是用于检验回归模型的统计量,有四个数值,第一个是R2,其中R是相关系数,第二个是F统计量值,第三个是与统计量F对应的概