资源描述:
《多粒度时间序列中模糊规则的提取》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第35卷第9期上海交通大学学报Vol.35No.92001年9月JOURNALOFSHANGHAIJIAOTONGUNIVERSITYSep.2001文章编号:1006-2467(2001)09-1366-04多粒度时间序列中模糊规则的提取张竹润,谢康林,张忠能(上海交通大学计算机科学与工程系,上海200030)摘要:介绍了一种从多粒度时间序列中提取模糊规则的数据挖掘方法,该方法在时间序列中引入多重时间粒度,以模糊规则的形式给出数据挖掘的结果.建立多粒度时间序列的数学模型,并对提取模糊规则中所涉及的一些基本概念作出定义.在此基础上,给出
2、数据挖掘的具体算法.通过实验证明了该挖掘算法的有效性.关键词:数据挖掘;模糊规则;时间序列中图分类号:TP311文献标识码:ADiscoveringFuzzyRulesinMultipleGranularityTimeSeriesZHANGZhu-run,XIEKang-lin,ZHANGZhong-neng(Dept.ofComputerScienceandEng.,ShanghaiJiaotongUniv.,Shanghai200030,China)Abstract:Adataminingmethod,whichdiscoversf
3、uzzyrulesinmultiplegranularitytimeseries,waspro-posed.Thismethodintroducesamultiplegranularityintotimeseriesandprovidestheoutcomeofdataminingintheformoffuzzyrules.Afterthemathematicalmodelofmultiplegranularitytimeseriesises-tablished,somenotationsrelatedtotherulediscover
4、ingaredefined.Theminingalgorithmispresentedindetails.Theresultsofsomeexperimentsarealsoprovidedtoindicatethevalidityoftheminingalgorithm.Keywords:datamining;fuzzyrule;timeseries近几年来,随着数据库技术的不断发展与广泛1模型的建立及有关定义应用,数据库中存储的数据量急剧增大.在浩如烟海的数据背后,隐藏着许多有重要价值但又不易为人1.1时间序列们所察觉的知识,如何从
5、中挖掘出可信的、新颖的、在数据挖掘之前,首先要搜集大量的相关数据.能被理解的信息,对于管理和决策来说无疑有着非从时间序列的角度来看,每个数据单元可以被抽象常重大的现实意义.在许多实际的数据库应用系统为一个二元组(t,o).其中:t为时间变量;o为数据变中,大部分的数据是以时间序列的形式表现出来的.量,反映数据单元的实际意义,诸如某种商品的销售如:证券交易中各种股票的价格与成交量、企业各种金额、股票的价格等.由此,对于时间序列可以给出[1,2]商品的销售金额等.针对这类数据,本文提出了如下的定义.一种从时间序列中提取模糊规则的数据挖掘方法
6、.定义1时间序列是一个有限集这种方法在时间序列中引入多重时间粒度,然后以{(t1,o1),(t2,o2),⋯,(tn,on)}此为依据,对各种变量进行适当的模糊化,并最终以满足:ti7、uzzySubset1andd2is定义2设T=(-∞,+∞)(T代表时间),则FuzzySubset2T+T2为T的幂集.如果是从正整数集Z到2的映thenw3(3)isFuzzySubset3射,并且满足对于任意正整数i,j(i8、额会较前1个月有则称为时间粒度函数,或简称为粒度函数.很大的增加等.定义3对于任意整数k和任意两个不同的粒1.4数据挖掘问题度函数、,令P={p(p)(k)},如果P≠,设!=(,1,2,⋯