欢迎来到天天文库
浏览记录
ID:5350646
大小:183.42 KB
页数:4页
时间:2017-12-08
《基于信息论网络的时序数据库挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、维普资讯http://www.cqvip.com业业业睾·数据库与信息处理·鼍齐齐齐齐齐齐齐齐基于信息论网络的时序数据库挖掘林芝曹加恒刘娟韦丰(武汉大学计算机学院,武汉430072)(华中科技大学计算机学院,武汉430073)E—mail:linzhiwh@sina.COB.ca摘要介绍了如何对时序数据库进行数据库挖掘,其中包括数据预处理,识别重要的预测属性,提取相应的关联规则。文章采用的是基于信号处理和信息论网络的方法,并使用模糊和集成的概念来简化规则库。关键词时序数据库数据挖掘信息论网络模糊化关联规则
2、文章编号l0o2—8331一(2003)O1—0l88-03文献标识码A中图分类号rP3l1.13DataMininginTimeSeriesDatabaseBasedonFuzzyInformation-TheoreticNetworkLinZhiCaoJiahengLiuJuanWeiFengz(SchoolofComputerScience,WuhanUniversity.Wuhan430072)(SchoolofComputer,Science,HuazhongUniversityofScienc
3、e&Technology,Wuhan430073)Abstract:ThispaperintroducesagenerMmethodforknowledgediscoveryintimeseriesdatabase.Theprocessincludesdatamining,identifingthemostimportantpredictingattributes,andextractingasetofassociationruleswhichcanbeusedtopredictthetimeseries
4、behaviorinthefuture.Thismethodisbasedonsignalprocessingtechniquesandtheinformation-theoreticfuzzyapproach.Keywords:TimeSeriesDatabase,DataMining,Information—theoreticNetwork,FuzzyAssociationl概述通过信息论网络来进行数据挖掘,第五部分以股票系统为例实时序数据库在现实生活中有广泛的应用,证券交易数据践了以上方法,第六部分
5、将对以上内容作一小结。库,期货交易系统,在线监控系统等都是时序数据库。时序数据库是相对于静态数据库而言的,它们的区别在于:第一,静态数2问题的描述据库包括一系列记录,记录的排列次序是任意的。而在时序数定义l:一个时序数据库包括一系列记录lr】.,每一个记据库中,记录不能任意排列,记录中的某些属性带有时间戳,因录包含有一系列的属性和一个时间值此其排列有内在联系。证券数据库就是一个典型的时序数据lⅡl,a2,a3⋯,(1)库,每只股票的收盘价与交易Et紧密联系,而且一段时间的变属性al若与时间有关则为动态属性
6、,否则为静态属性。£,化趋势也与时间紧密相关,它是时序数据库挖掘的重要内容。是一个时间值,比方说年,月,Et。第二,在静态数据库中,属性与属性之间相互独立,而在时序数定义2:属性函数是一个时间函数据库中某些属性是时间函数,相互关联。时序数据库中的属性o~(tj)=aiai,∈(2)有静态和动态之分,例如在证券数据库中静态属性包括股票名ai第i个属性称和证券代码,动态属性包括收盘价及交易数据等。rj数据库中的第个记录对于时序数据库研究者们提出过许多方法。这里介绍一种记录的时间戳方法,它能完成时序数据库挖掘的
7、全过程,它包括了预处理和定义3:在区间【£l,£2】中定义一个特征函数(t),使某一数据挖掘。属性的时间函数q(£)趋近它。参见文献【2】。文章的第二部分给出了时序数据库的有关定义,第三部分(£)一(£)t∈【tl,t2】(3)介绍一种通用时序数据库的预处理方法,第四部分重点介绍了显然它可以表示为:Iq(£)一(£)l<£t∈【tl,t2】基金项目:湖北省自然科学基金资助项目(编号:2000J157)作者简介:林芝,女,硕士生,主要研究方向为数据库,数据挖掘,计算机多媒体技术。曹加恒,男,教授,主要研究方
8、向为数据库,数据挖掘,计算机多媒体技术,人工智能及神经网络。刘娟,女,硕士生,主要研究方向为数据库,数据挖掘,计算机多媒体技术。韦丰,男,硕士生,主要研究方向为数据存储,计算机系统结构,计算机多媒体技术。18820o3.0l计算机工程与应用维普资讯http://www.cqvip.com在这一定义中中和它的参数是nf(£)在时间区间【£1,£2】的如果leti—dI<0.05,则把t从序列中去掉,这样每个时特征值。比方说中(£
此文档下载收益归作者所有