用遗传算法对时间序列进行异常点挖掘

用遗传算法对时间序列进行异常点挖掘

ID:33305129

大小:1.17 MB

页数:49页

时间:2019-02-24

用遗传算法对时间序列进行异常点挖掘_第1页
用遗传算法对时间序列进行异常点挖掘_第2页
用遗传算法对时间序列进行异常点挖掘_第3页
用遗传算法对时间序列进行异常点挖掘_第4页
用遗传算法对时间序列进行异常点挖掘_第5页
资源描述:

《用遗传算法对时间序列进行异常点挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东南大学硕士学位论文用遗传算法对时间序列进行异常点挖掘姓名:陈莺申请学位级别:硕士专业:概率统计指导教师:陈平20060201摘要随着现代信息技术的发展,人们在对大量的时间序列数据的处理过程中,日益发现了时间序列中异常点的重要性,其中可能蕴涵着大量的有用信息.因此,越来越多的学者开始致力于探测时间序列中的异常点.本文介绍了如何利用遗传算法对ARMA序列中可加性异常点(AO)和革新型异常点(IO)进行探测,并将此方法推广到ARMAX序列.遗传算法是人们模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法

2、.它可以对多个异常点模式同时进行比较,所以该方法可以很好地解决异常点探测中极有可能出现的淹没(不是异常点而被识别为异常点)和掩蔽(是异常点而没有被识别出来)问题.本文利用标准遗传算法和精英策略(即每代中的最佳个体不参与选择,交叉或变异以保证在进化过程中适应度函数是不降的).适应度函数由似然函数和异常点的个数共同决定.由于遗传算法的计算量往往比较大,因此快速有效的算法对它而言很重要.我们利用AO和IO与逆自相关系数之间的关系以简化适应度函数,使其可以利用Trench算法进行快速计算.对于数据量很大的序列,我们采用交叉分段挖掘

3、法,即将序列分为几段使其前后两段子序列有交叉重叠的部分.这样既很好地解决了个体总数s过大而带来的一系列问题,又可以避免丢失恰好处于分段点附近的异常点.最后,我们分别分析了几组模拟数据和实际数据以检验我们的方法,结果表明我们的方法可以有效地识别时间序列中异常点的类型,位置和异常程度大小.关键词:AO;IO;ARMA序列;ARMAX序列;输入序列;逆自相关系数;遗传算法;插值估计.中图分类号:0212.2AMS(2000)主题分类;62M10AbstractWiththedevelopmentofmoderninformati

4、ontechnology,theimportanceofoutliem,whichmaycontainalotofusefulinformation,hasbeenbeingpaidmoreattentiontoaspeoplehandlewithdataintimeseries.So,moreandmorescholarshavecommittedthemselvestoident姆ingoutliers.Inthispaper,ageneticalgorithmisproposedforident姆ingadditiv

5、eandinnovationaloutliersinARMAandARMAXseries.Thegeneticalgorithmallowssimultaneouscomparisonofagreatnumberofoutliem’patterns.弛waywemayhopetoovercometheproblemsofmaskingandswamping,thatareverylikelytoariseinthecomtextoftimeseries柚alysi8withaberrantobservations.Weal

6、eusingthestandardgeneticalgorithmwithcompletereplaeementofthepastpop-ulationandelitiststrategy.Itisapparentthatfastcomputationisnecessaryforthegeneticalgorithmapproachtoturnoutviableinpractice.Therelationshipbetweeninver8ecorrela-tiousandoutliersishelpfultosimplif

7、ythe矗tnessfunction,whichmayhequicklycomputedbyTrench’salgorithm.Forthecaseoflargeseries.itisbettertodevidetheseriesintoseveralpartssothatthetwoneighboursubseriessharealerIgthofsanledata,andthentodetectthesubseriesrespec-tively.Thus,theproblemoflargepopulationingen

8、eticalgorithmshasbeenavoided,aswellasthelossofoutliersaroundthecutpoint.Someca黯studiesshowthatthealgorithmiseffectiveindetectingoutliers’locationandtype

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。