欢迎来到天天文库
浏览记录
ID:35985437
大小:86.00 KB
页数:7页
时间:2019-04-29
《数据拟合方法.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二讲数据拟合方法在实验科学、社会科学和行为科学中,实验和戡测常常会产生大量的数据。为了解释这些数据或者根据这些数据做出预测、判断,给决策者提供重要的依据。需要对测量数据进行拟合,寻找一个反映数据变化规律的函数。数据拟合方法与数据插值方法不同,它所处理的数据量大而且不能保证每一个数据没有误差,所以要求一个函数严格通过每一个数据点是不合理的。数据拟合方法求拟合函数,插值方法求插值函数。这两类函数最大的不同之处是,对拟合函数不要求它通过所给的数据点,而插值函数则必须通过每一个数据点。例如,在某化学反应中
2、,测得生成物的质量浓度y(10–3g/cm3)与时间t(min)的关系如表所示t12346810121416y4.006.418.018.799.539.8610.3310.4210.5310.61显然,连续函数关系y(t)是客观存在的。但是通过表中的数据不可能确切地得到这种关系。何况,由于仪器和环境的影响,测量数据难免有误差。因此只能寻求一个近拟表达式y=(t)寻求合理的近拟表达式,以反映数据变化的规律,这种方法就是数据拟合方法。数据拟合需要解决两个问题:第一,选择什么类型的函数作为拟合函数(数学
3、模型);第二,对于选定的拟合函数,如何确定拟合函数中的参数。数学模型应建立在合理假设的基础上,假设的合理性首先体现在选择某种类型的拟合函数使之符合数据变化的趋势(总体的变化规律)。拟合函数的选择比较灵活,可以选择线性函数、多项式函数、指数函数、三角函数或其它函数,这应根据数据分布的趋势作出选择。为了问题叙述的方便,将例1的数据表写成一般的形式tx1x2x3x4x5x6x7x8x9x10yy1y2y3y4y5y6y7y8y9y10一.线性拟合(线性模型)假设拟合函数是线性函数,即拟合函数的图形是一条平
4、面上的直线。而表中的数据点未能精确地落在一条直线上的原因是实验数据的误差。则下一步是确定函数y=a+bx中系数a和bt各等于多少?从几何背景来考虑,就是要以a和b作为待定系数,确定一条平面直线使得表中数据所对应的10个点尽可能地靠近这条直线。一般来讲,数据点将不会全部落在这条直线上,如果第k个点的数据恰好落在这条直线上,则这个点的坐标满足直线的方程,即a+bxk=yk如果这个点不在直线上,则它的坐标不满足直线方程,有一个绝对值为的差异(残差)。于是全部点处的总误差是这是关于a和b的一个二元函数,合理
5、的做法是选取a和b,使得这个函数取极小值。但是在实际求解问题时为了操作上的方便,常常是求a和b使得函数达到极小。为了求该函数的极小值点,令,,得,这是关于未知数a和b的线性方程组。它们被称为法方程,又可以写成求解这个二元线性方程组便得待定系数a和b,从而得线性拟合函数y=a+bx。下图中直线是数据的线性拟合的结果。二.二次函数拟合(二次多项式模型)假设拟合函数不是线性函数,而是一个二次多项式函数。即拟合函数的图形是一条平面上的抛物线,而表中的数据点未能精确地落在这条抛物线上的原因是实验数据的误差。则
6、下一步是确定函数y=a0+a1x+a2x2中系数a0、a1和a2t各等于多少?从几何背景来考虑,就是要以a0、a1和a2为待定系数,确定二次曲线使得表中数据所对应的10个点尽可能地靠近这条曲线。一般来讲,数据点将不会全部落在这条曲线上,如果第k个点的数据恰好落在曲线上,则这个点的坐标满足二次曲线的方程,即a0+a1xk+a2xk2=yk如果这个点不在曲线上,则它的坐标不满足曲线方程,有一个误差(残差)。于是全部点处的总误差用残差平方和表示这是关于a0、a1和a2的一个三元函数,合理的做法是选取a0、
7、a1和a2,使得这个函数取极小值。为了求该函数的极小值点,令,,得这是关于待定系数a0、a1和a2的线性方程组,写成等价的形式为这就是法方程,求解这一方程组可得二次拟合函数中的三个待定系数。下图反映了例题所给数据的二次曲线拟合的结果三.数据的n次多项式拟合xx1x2……xmf(x)y1x2……ym已知函数在个离散点处的函数值,假设拟合函数是n次多项式,则需要用所给数据来确定下面的函数y=a0+a1x+a2x2+……+anxn这里要做一个假设,即多项式的阶数n应小于题目所给数据的数目m(例题中m=10
8、)。类似前面的推导,可得数据的n次多项式拟合中拟合函数的系数应满足的正规方程组如下从这一方程组可以看出,线性拟合方法和二次拟合方法是多项式拟合的特殊情况。从算法上看,数据最小二乘拟合的多项式方法是解一个超定方程组(m>n)的最小二乘解。而多项式拟合所引出的正规方程组恰好是用超定方程组的系数矩阵的转置矩阵去左乘超定方程组左、右两端所得。正规方程组的系数矩阵是一个病态矩阵,这类方程组被称为病态方程组。当系数矩阵或者是右端向量有微小的误差时,可能引起方程组准确解有很大的误差
此文档下载收益归作者所有