基于数据自然规律的不同拟合方法比较研究

基于数据自然规律的不同拟合方法比较研究

ID:27514855

大小:55.50 KB

页数:7页

时间:2018-12-04

基于数据自然规律的不同拟合方法比较研究_第1页
基于数据自然规律的不同拟合方法比较研究_第2页
基于数据自然规律的不同拟合方法比较研究_第3页
基于数据自然规律的不同拟合方法比较研究_第4页
基于数据自然规律的不同拟合方法比较研究_第5页
资源描述:

《基于数据自然规律的不同拟合方法比较研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于数据自然规律的不同拟合方法比较研究摘要:目的:寻找最优的数据拟合方法;方法:以数据为基础,分别用统计方法中的趋势法、分段法、AID法(AutomaticInteractionDetection)进行拟合,通过比较拟合值与实际值,并计算各方法的均方误差,分析上述3种方法的拟合精度;结果:分段法所拟合的数据误差最小,拟合精度最高;结论:对于收集的可靠数据进行拟合时,须采用多个适用的拟合方法分别拟合,并进行比较后选择一个模型显著,精度高的作为最终决策模型,效果会更好。中国4/vie  关键词:拟合方法比较;趋势法;分段法;AID

2、法;应用条件;拟合精度  中图分类号:C37文献标识码:A:1673-1069(2017)04-122-2  1概述  拟合方法是统计预测的前提,拟合模型建立的不好,何谈预测效果?鉴于近30年来的各种规划涉及的预测方法应有尽有,但这些预测存在的一个严重问题是相差几百万、几千万都丝毫没有影响到“规划”的所谓科学性、合理性,这正是做课题人员的统计预测知识缺乏,而导致规划中预测结果的“宽范围”特殊性,使的规划检查执行进度时出现预测结果与后期实际结果相差得经过很长的时间才有可能,甚至永远不可能实现的困境。这里基于数据本身的特征�M行拟

3、合效果比较,进而达到拟合效果高精度实现。关于数据本身的规律大体上表现为两大类,一类是横截面数据的拟合,这一类大多涉及到多元回归问题,更多的是对所建模型利用样本区间以外的影响因素数据进行预测;另一类是时间序列数据的预测,更注重于趋势预测。本文主要研究时间序列数据的拟合问题。  在时间序列预测中,当序列存在明显的趋势成分时,需要使用趋势预测法[1]进行预测。然而有时候单一形式曲线的预测效果并不是很好。对此,李武选通过对旅游外汇收入数据采用分段拟合技术[2]建立模型进行预测,取得比单一形式曲线更好的拟合精度;方开泰使用AID法[3]

4、将数据分区间进行拟合,发现AID法在有异常数据的预测中比单一形式曲线有更好的效果。钱晓莉[4]将AID法应用于通过企业的广告费用预测销售收入的实例中,指出该法适宜于对含有特异值的样本进行预测。本文通过对某地的有关预报数据进行实证分析,用这3种拟合方法进行拟合,并比较三者的拟合效果。  2研究方法及其应用条件  2.1趋势拟合法  在趋势拟合法中主要有线性趋势和非线性趋势两种方法。线性趋势是指研究现象随着时间的推移而呈现出稳定增长或下降的线性变化规律,其线性拟合方程为yt=b1+b1t,其中待定系数和可根据最小二乘法求解。当所要

5、研究现象呈现出某种非线性趋势,则需要拟合适当的趋势曲线。这种方法应用要求时间序列数据本身具有明显的趋势特征,如线性或者非线性特征。  2.2分段拟合法  分段拟合法根据所要研究对象随时间的推移呈现出不同类型的趋势变化将其分段,针对每段进行拟合,最后整合出整体数据的拟合情况。此法应用条件是数据自然的规律要具有线性及非线性或者拐点等特征。  2.3AID拟合法  AID拟合法是将有序样本数据合理分类,划分各类的原则是最优分割原则,最后根据要拟合的值所属类的平均值作为其拟合值。该法的应用条件是数据本身应具有明显的波动聚集特征。  3

6、实证分析  3.1数据来源  本文研究方法使用的实际数据(见表1):  该数据具有适用于上述3种拟合方法的基本要求,可以使用上述方法建立拟合模型并可以进行拟合。  3.2趋势拟合法  用SPSS20.0软件中11种常用的趋势曲线进行拟合,依据最大作为选择标准,可得较满意S曲线拟合。  结果说明:以上两个p值均小于0.05,表明模型中变量之间的关系在统计意义上是显著的;统计量F=10.120,Sig=0.011<0.05,表明S曲线模型整体上是统计显著的,即模型可用。  3.3分段拟合法  通过对数据做散点图可看出将该时间序列分

7、为三段较好,第一段包括前四个时间序列数据,第二段包括接下来的中间的三个数据,第三段包括剩下的四个数据,然后针对每段建立模型进行拟合。在对每段进行拟合时,通过SPSS20.0软件中11种常用的趋势曲线进行拟合,根据拟合优度系数最大以及模型中系数与模型整体的统计显著性选择最优的拟合模型。  结果说明:以上三个模型,对系数的t检验以及对整个模型的F检验结果都是统计显著的,故模型均是合理的,可以用来拟合。  3.4AID拟合法  先将该时间序列数据分类。最优分割原则是使组内离差平方和达到极小,并且每次分类时都将一组数据只分成两类。由总

8、离差平方和=组内离差平方和+组间离差平方和可知,要使组内离差平方和极小化,则要使组间离差平方和极大化。计算可得总体均值=6.91。组间平方和QA=n1(・1-)2+n2(・2-)2,其中nj为第j(j=1,2)类包含的数据的个数,・j为第j(j=1,2)类的均值。分别以t=1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。