资源描述:
《一种支持时间序列数据的cbr检索算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第2卷第1期智能系统学报Vol.2№.12007年2月CAAITransactionsonIntelligentSystemsFeb.2007一种支持时间序列数据的CBR检索算法11,22史忠植,尹超,叶世伟(1.中国科学院计算技术研究所智能信息处理重点实验室,北京100080;2.中国科学院研究生院信息科学与工程学院,北京100039)摘要:探讨了如何为CBR(基于范例的推理)增加对一种特殊的范例类型———时间序列数据的支持.分析了基于谱分析的时间序列相似度比较算法不适用于CBR检索的缺点,并在此基础上设计了一种综合性能很好
2、的CBR检索算法.思路是把时间序列相似度比较转化成一个卷积问题,并用DFT来简化这个卷积的计算.通过对这种CBR检索算法进行了深入的理论分析和认真的实验,结果证明,提出的算法是一个高效的算法.在这个检索算法的基础上,CBR就能够应用到时序数据的分析推理中,具有广阔的应用前景.关键词:基于范例的推理;时间序列数据;相似度比较中图分类号:TP399文献标识码:A文章编号:167324785(2007)0120040205ACBRalgorithmsupportingtimeseriesdata11,22SHIZhong2zhi,Y
3、INChao,YEShi2wei(1.KeyLaboratoryofIntelligentInformationProcessing,InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100080,China;2.SchoolofInformationScienceandEngineeringGraduateUniversityofChineseAcademyofSciences,Beijing100039,China)Abstract:Thispap
4、erfocusesontheretrievalalgorithmsofaspecialkindofCBRsysteminwhichcasesarecomposedoftime2seriesdata.Weintroducedtheclassicalalgorithmusedforprocessingsimilarityqueriesontimeseriesdata.ThisalgorithmisbasedonthefactthatDFTpreservestheEuclideandistanceinthetimeorfrequen
5、cydomain,andonlythefirstfewelementsofthefrequencysequencearesignificant,sotheretrievalprocesscanonlyusethesesignificantelementstocomputesimilaritydegree.However,thisalgo2rithmhasseveraldisadvantageslimitingitsusageinCBRretrieval,soanewalgorithmispresentedforu2singba
6、tchmethodtocomputethesimilaritydegree.Itisbasedontheobservationthattheoriginalproblemcanbetransformedtoaconvolutionproblem,andthecircularconvolutioncanbecomputedmoreefficientlyusingFFT.Theoreticalanalysisandexperimentresultprovethatthisalgorithmisefficientandrobust.
7、ThealgorithmpresentedinthispaperfurnishestheCBRwiththeabilitytoprocesscasesconsistoftime2seriesdata.Keywords:case2basedreasoning;timeseriesdata;similaritycomparison基于范例的推理(case2basedreasoning,CBR)间信息的重要性,很多情况下,感兴趣的不仅仅是独是实现人工智能的一种重要方法,它是对人类思维立的快照(snapshot),而是一段连续的片段(
8、epi2过程的模仿.CBR在如下情形下效果比较好:1)知sode),甚至是对将来的预测.举个例子,在诊断病人识的主要来源是经验,而不是理论;2)解决方案是可的时候,医生不仅要了解患者目前的症状,也要了解重用的;3)目标是求出可行解而非最优解.在过去的其病史.医生对同样的症状最