资源描述:
《十五个数学模型6多元回归模型.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、回归模型1基本知识介绍1.1回归模型的引入由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。所以在遇到有些无法用机理分析建立数学模型的时候,通常采取搜集大量数据的办法,基于对数据的统计分析去建立模型,其中用途最为广泛的一类随即模型就是统计回归模型。回归模型确定的变量之间是相关关系,在大量的观察下,会表现出一定的规律性,可以借助函数关系式来表达,这种函数就称为回归函数或回归方程。1.2回归模型的分类2用回归模型解题的步骤回归模型解题步骤主要包括两部分,一:确定回归模型属于那种基本类型,然后通
2、过计算得到回归方程的表达式;二:是对回归模型进行显著性检验。一:①根据试验数据画出散点图;②确定经验公式的函数类型;③通过最小二乘法得到正规方程组;④求解方程组,得到回归方程的表达式。二:①相关系数检验,检验线性相关程度的大小;②F检验法(这两种检验方法可以任意选);③残差分析;④对于多元回归分析还要进行因素的主次排序;如果检验结果表示此模型的显著性很差,那么应当另选回归模型了。3模型的转化非线性的回归模型可以通过线性变换转变为线性的方程来进行求解:例如函数关系式:可以通过线性变换:转化为一元线性方程组来求解,对于多元的也可以进行类似的转换。4举例
3、例1(多元线性回归模型):已知某湖八年来湖水中COD浓度实测值(y)与影响因素湖区工业产值(x1)、总人口数(x2)、捕鱼量(x3)、降水量(x4)资料,建立污染物y的水质分析模型。(1)输入数据x1=[1.376,1.375,1.387,1.401,1.412,1.428,1.445,1.477]x2=[0.450,0.475,0.485,0.500,0.535,0.545,0.550,0.575]x3=[2.170,2.554,2.676,2.713,2.823,3.088,3.122,3.262]x4=[0.8922,1.1610,0.534
4、6,0.9589,1.0239,1.0499,1.1065,1.1387]y=[5.19,5.30,5.60,5.82,6.00,6.06,6.45,6.95](2)保存数据(以数据文件.mat形式保存,便于以后调用)savedatax1x2x3x4yloaddata(取出数据)(3)执行回归命令[b,bint,r,rint,stats]=regress(y,x)得结果:b=(-16.5283,15.7206,2.0327,-0.2106,-0.1991)’stats=(0.9908,80.9530,0.0022)即:==-16.5283+15.7
5、206xl+2.0327x2–0.2106x3+0.1991x4R2=0.9908,F=80.9530,P=0.0022通过查表可知,R2代表决定系数(R代表相关系数),它的值很接近与1,说明此方程是高度线性相关的;F检验值为80.9530远大于,可见,检验结果是显著的。例2(非线性回归模型)非线性回归模型可由命令nlinfit来实现,调用格式为[beta,r,j]=nlinfit(x,y,'model’,beta0)其中,输人数据x,y分别为n×m矩阵和n维列向量,对一元非线性回归,x为n维列向量model是事先用m-文件定义的非线性函数,bet
6、a0是回归系数的初值,beta是估计出的回归系数,r是残差,j是Jacobian矩阵,它们是估计预测误差需要的数据。预测和预测误差估计用命令[y,delta]=nlpredci(’model’,x,beta,r,j)如:对实例1中COD浓度实测值(y),建立时序预测模型,这里选用logistic模型。即(1)对所要拟合的非线性模型建立的m-文件mode1.m如下:functionyhat=model(beta,t)yhat=beta(1)./(1+beta(2)*exp(-beta(3)*t))(2)输人数据t=1:8loaddatay(在data
7、.mat中取出数据y)beta0=[50,10,1]’(3)求回归系数[beta,r,j]=nlinfit(t’,y’,’model’,beta0)得结果:beta=(56.1157,10.4006,0.0445)’即(4)预测及作图[yy,delta]=nlprodei(’model’,t’,beta,r,j);plot(t,y,’k+’,t,yy,’r’)3.逐步回归逐步回归的命令是stepwise,它提供了一个交互式画面,通过此工具可以自由地选择变量,进行统计分析。调用格式为:stepwise(x,y,inmodel,alpha)其中x是自变
8、量数据,y是因变量数据,分别为n×m和n×l矩阵,inmodel是矩阵的列数指标(缺省时为全部自变量),alpha,为显著