欢迎来到天天文库
浏览记录
ID:55398936
大小:200.88 KB
页数:4页
时间:2020-05-15
《基于惩罚回归样条的函数导数拟合.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、^2015年2月安庆师范学院学报(自然科学版)Feb.2O15第21卷第1期VO1.21N0.1JournalofAnqingTeachersColege(NaturalScienceEdition)DOI:10.13757/j.cnki.cn34一l150/n.2015.01.004基于惩罚回归样条的函数导数拟合关海洋,唐燕武,杨联强(1.安徽大学数学科学学院,安徽合肥230601;2.安庆师范学院数学与计算科学学院,安徽安庆246133)摘要:在函数形式未知,而已知该函数的带误差的离散数据点情况下,运用基于P次截断幂基的惩罚回归样条拟合
2、数据点,并在拟合出的曲线基础上求出函数的一阶导数。该方法将经典最小二乘法和惩罚样条方法进行结合,既考虑了拟合优度,又兼顾拟合曲线的光滑性,模拟和实际应用的例子显示此种方法效果较理想。关键词:数据拟合;回归;惩罚样条;导数中圈分类号:0212.7文献标识码:A文章编号:1007—4260(2015)01—0013—03函数导数的计算是理论分析和实际应用中1,2,⋯,n,设其隐含的函数关系表示为最常见的运算,但在很多情况下并不知道函数的Y=)十f初等形式,直接基于函数表达式的求导法则此时其中s~N(O,)为随机误差项q厂未知,将基于是无法使用的
3、。例如,在现实世界中,有些函数只P次截断幂基的样条函数设为能收集到一些离散数据点(,Y),而且这些点是i)=+卢1+⋯++受到误差影响的,即Y=)+,是随机误差项,且未知,此时如何估计该函数的导数值。∑(一K^):该类问题在工程技术、数据分析等实际问题中非其中常普遍,所以对它的研究颇为重要。已有的导数估卢=(,卢一,,一,)计方法有Bessel方法和Akima方法J,而邢永旭,Y=(Y1,Y2,⋯,Y)张彩明在此基础上得到了基于三次参数曲线Xi=(1,,⋯,,(—K1)P+,⋯,(l一,c))新的导数估计方法。JiguoCao,JingCa
4、i,LiangliangWang_3提出参数惩罚样条回归方法X=(X,,⋯,)估计函数及导函数曲线,并得出此种估计方法的占=(1,2,⋯,)精确性较高。江桂清给出了连续约束和离散约则束这两种对风洞试验所得的数据进行导数拟合方Y=+占(1)法,樊天薇则给出了基于离散数据点的一阶导其中(k=1,2,⋯,)为节点,(一)=数估计方法。本文给出一种新的基于P次截断幂基的惩罚样条回归方法来拟合带有噪音数据的函J_0,Xi≤称为p次截断幂。【(一,c)p,i>,c数及其导数,并通过模拟和实际例子来演示该方法的有效性。令是卢的普通最小二乘估计量,则根据普
5、通的最小二乘回归可知,1惩罚回归样条拟合函数及其导数对于给定的带有噪音的数据点(,Y),i=/3=(XX)XY(2)收稿日期:2014—7—31基金项目:国家自然科学基金(11026076),安徽省高校教学研究项目(2012JYXM094)。作者简介:关海洋,男,安徽阜阳人,安徽大学数学科学学院硕士研究生,研究方向为统计学。通讯作者:杨联强,男,安徽桐城人,博士,安徽大学数学科学学院副教授,研究方向为数据分析与统计计算。·14·安庆师范学院学报(自然科学版)2015年则Y的估计值2模拟Y=(3)本节给出两个模拟实例,以显示本文所提出此时称函
6、数)=卢0+卢lf+⋯+JB+方法的拟合效果,所有计算、作图、分析工作均在R3.02中完成。∑(一)p+为拟合曲线。一般情况下,特别例1图1给出了对函数Y:一sink+,∈是数据点较多时,此时求出的拟合曲线往往存在过度拟合现象],即曲线局部振荡比较严重。弥[1,20]等距取值,一N(0,0.1)随机产生的样补这一缺陷的一个做法是对口作“惩罚”,令本容量为n=200的函数散点图,以及真实函数D:diag(0+1,1)曲线和拟合函数曲线。图2显示的是真实导函数即D表示前P+1个元素为0后K个元素为1的曲线和基于本文方法的拟合导函数曲线,其中样对
7、角矩阵。并设模型(1)拟合目标函数为条次数P=3。图3表示GCV随着光滑参数A的变lIy一8ll+A卢D(4)化图。其中AD称作惩罚项,A称作惩罚参数,则卢的广义最小二乘估计量为=(XX+AD)-1Xy(5)从目标函数的设置易知,惩罚参数A是用其来控制拟合曲线的对数据的拟合优度与曲线总体光滑度之间的平衡。如果太大的话会使得曲线整体过于光滑,而太小导致曲线波动性较大,对于它最优值的选择本文采用的是广义交叉验证XGCV(generalizedcross—validation)法,即通过搜图1函数及其拟合索最佳的A,使得如下定义的GCV得分达到最
8、小]ccV㈨=其中RSS(A)=lly—ylI,tr()是=X(xX+A。D)x的迹。而样条函数节点位置的选择采用等分位点方法[6],即是的分位点,其中图2导函数及其拟合K,k=
此文档下载收益归作者所有