资源描述:
《《化工数值计算》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、回归分析和曲线拟合生产过程和科学实验中,常用的变量大体可分两类。一类为确定性变量,另一类为随机变量。确定性变量是指两个或多个变量之间有确定的关系.即其中某个变量的每个值,都与一变量的一个或几个完全确定的值相对应,即它们之间存在着函数关系:例如,理想气体的压力P与摩尔体积V间,存在着确定的函数关系:但在实际问题中,由于变量之间的关系比较复杂,或由于生产或实验过程中不可避免地存在着误差,使变量之间的关系具有不确定性,也就是说,某个变量对应的,不是一个或几个确定的值,而是整个集合的值,这时,变量x和y间的关系,就称为相关关系。例如,流体在圆形直管中做湍流时的情形,通过量纲分析可知,努塞尔特数Nu、普
2、兰特数Pr和雷诺数Re之间存在着如下相关关系:这种关系的不确定性,表现为式中a和b的数值,在每次测量中不尽相同。不确定的原因,首先是影响该过程的因素甚多,有些因素至今尚未弄清;其次是受到实验过程中的偶然因素影响。这种不确定性关系并不说明上述三个量纲为1的数群之间无规律可循。相反,通过大量试验,人们发现,a和b的数值总是围绕着某一定值波动,而且随着试验次数的增多,a、b的数值趋于稳定。a、b的稳定值,可作为a和b的最佳估计值。在一定条件下,a=0.023,b=0.8。由此可见,通过大量试验,是可以找到隐藏在随机性后面的统计规律性的。回归分析和曲线拟合是一种处理变量相关关系的数理统计方法。用它可以
3、寻找隐藏在随机性后面的统计规律性。函数与相关是两种不同类型的变量关系,它们之间并无严格界限。一方面,相关的变量之间,并无确定的关系,但在一定的条件下,从一定的统计意义上看,它们之间又可能存在着某种确定的函数关系。另一方面,由于实际测定的数据中,总存在着误差,即使是确定性变量,也会出现某些非确定性结果。6.1 一元线性回归一元线性回归处理的是两个变量之间的线性关系。所用的数学模型为一元线性代数模型,其模型方程式是对这种模型参数的估计,就是根据原始数据点(x1,y1)、(x2,y2)、…、(xi,yi)、…、(xn,yn),确定式(6-1)中a、b的估计值。在实际体系中,自变量x与因变量y之
4、间服从线性关系的情况虽然不多,但在不少情况下,x、y之间存在着某种函数组合关系。例如f1(x,y),f2(x,y),设两个函数之间服从线性关系f1与f2是不含待定系数的已知函数。若把f1(x,y)与f2(x,y)分别视为自变量与因变量,则仍可以借用线性模型去估计其参数值。这种方法称为化直法。它在化学化工的实际问题中是常见的。例如单分子基元反应AB的动力学方程式为对上式积分得式中,cA-t是不呈线性关系的函数。若对方程两边取对数,上式可化为lncA-t的线性函数:又例如,按照阿仑尼乌斯定律,反应速率常数k与温度T之间不呈线性关系:但lnk与1/T则呈线性关系:这些都是属于可化为线性关系的例子。一
5、元线性代数模型中的待定参数a和b,称为“估计值”。之所以称为“估计”值,是因为a,b的值是从实验值中通过数理统计方法确定的。图6-1 一元线性回归6.1.1 方法概述设有一组实验数据(x1,y1)、(x2,y2)、…、(xn,yn),自变量x与因变量y存在着式(6-1)的关系。当x取值为xi时,y的测定值为yi,计算值为yi*,并有由于参数a,b为未知值,故yi*也是未知值。若将全部实验数据标绘在x-y图中(见图6-1),由于各种因素的影响,它们不会全部落在一条直线上,即n个yi不会与n个yi*完全重合,它们将随机地分布在与xi呈线性关系的yi*的周围。以δi表示它们之间的差值,则有这里δi就
6、是误差。它反映了xi使yi偏离直线的各种影响因素的总和。现在,要寻找一条最靠近各个数据点的直线,这条直线称为回归直线。由于回归直线是一切直线中最接近各数据点(xi,yi)的,用它代表x与y之间的线性关系,比任何其他直线更为可靠。究竟如何确定回归曲线中的参数a和b呢?目前最常用的方法就是最小二乘法,即残差平方和最小法。式(6-3)中的误差δi又称为残差,表示第i个数据与回归直线的偏离程度,则残差平方和Q表示全部数据与回归直线的总偏离程度。显然Q是a和b的函数:不用残差和δi的原因是δi有正有负,相加时可能彼此抵消,从而不能反映总的偏离程度,而用残差的平方和不会发生这种现象。由多元函数的极值理论可
7、知,要使Q值最小,a、b必须满足下列条件:即得式(6-6)称为一元线性回归的正规方程组,通过求解该方程组,可得:式(6-7)中等号右侧的量全部取自原始数据。因此,就可以确定回归系数a和b,完成参数估计。为了简化a和b的表达式,定义:式中,、分别为xi和yi的平均值。xi与之差(xi-),称为xi的离差;全部xi的离差平方和,称为x的离差平方和,记为Lxx:yi与之差(yi-),称为yi的离差;全部