基于数据仓库的时序数据挖掘研究

基于数据仓库的时序数据挖掘研究

ID:32704973

大小:2.98 MB

页数:115页

时间:2019-02-14

基于数据仓库的时序数据挖掘研究_第1页
基于数据仓库的时序数据挖掘研究_第2页
基于数据仓库的时序数据挖掘研究_第3页
基于数据仓库的时序数据挖掘研究_第4页
基于数据仓库的时序数据挖掘研究_第5页
资源描述:

《基于数据仓库的时序数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于数据仓库的时序数据挖掘研究摘要f随着计算机、网络和通讯等信息技术和数据贮存技术的迅速发展,人们获取和存贮的数据急剧增长,出现了“数据泛滥,知识贫乏”的现象。传统的数据库技术和数据查询方法由于不能有效地管理和组织这些海量数据,已不能满足人们对隐含在数据中的知识的渴求,数据仓库和数据挖掘应运而生,并得到了迅速发展。数据仓库是面向主题的、集成的、不可更新的、随时间不断变化的、用于支持管理决策的数据集合。数据仓库通过一系列的数据处理过程对数据进行清洗,剔除缺损数据,获得高质量的数据,从而为数据挖掘从理论研究走向

2、实际应用提供了坚实的基础。数据挖掘则是数据库、人工智能、模式识别和统计分析等学科相互交叉、结合的前沿性研究领域,是人们从数据仓库等数据源中获得有用的、潜在的知识和信息的有力手段。随着计算机技术的发展,计算机上存储了越来越多的时序数据信息,时序数据广泛地存在于各个领域中,例如证券公司的大量股票信息,商场的POS系统大量的销售信息,人造卫星观测的气象信息和科学仪器所检测到的大量生物、地矿等信息。时序数据挖掘是数据挖掘中的一个重要研究领域,近年来越来越引起人们的重视。时序数据挖掘帮助人们获得时序数据中隐含的、有价

3、值的知识和信息。例如电力系统负荷时序数据中就包含着关于电力负荷特征的丰富信息,股票时间序列中包含着有关股票规律的潜在信息。因此,从时序数据中挖掘潜在的有用的知识有重要的理论和实践意义扣本文结合与宝钢合作的项目建立了宝钢的能源数据仓库,并在此基础上进行了时序数据挖掘的研究,包括时序数据中的相似性挖掘、时序数据离群数据挖掘、时序数据的规则挖掘和时序数据的趋势挖掘等。,本文的主要研究内容如下。(1)数据仓库是一种新的数据管理和组织技术,它与传统的数据库设计方法有所不同。本文结合宝钢能源数据仓库的设计和实施,进行了

4、数据仓库设计方法的研究,提出了一种面向对象的数据仓库设计方法,用于宝钢能源数据仓库的设计,并对宝钢的能源数据进行了一系列的预处理,获得高质量的数据,为数据挖掘奠定了坚实的基础。(2)时序数据担型蛙挖坦是数据挖掘的重要研究内容。本文针对时序数据的相似性挖掘,提出一种利用反馈的相似性挖掘算法,有效地增强了用户参与时序数据相似性挖掘的过程;然后提出一种变阈值的相似性挖掘算法,通过改变阈值,减小相似性挖掘的搜索范围,提高了计算效率;最后提出了一种新的时序数据降维方法,在此基础上进行了时序数据的相似性挖掘,降低计算的

5、复杂度。f3)离群时序数据挖掘是从大量的时序数据中挖掘明显偏离其它数据、不满足数据一般行为或模式、与存在的其他数据不一致的数据。本文对时序数据的离群挖掘进行了深入的研究,提出了一种新的离群数据的定义,用以有效地衡量各个离群数据点的离群程度。在此基础上,提出了一种基于距离的时序数据离群挖掘算法,能够有效地得到具有最强离群程度的前聍个离群数据。然后提出了一种基于划分的离群数据挖掘算法,将时序数据点划分为包含和不包含离群数据的划分,离群数据挖掘在可能包含离群数据的划分中进行,减小了计算复杂度;最后针对具有不同密度

6、的时序数据的离群挖掘,提出了一种新的基于离群指数的离群挖掘算法,能够在具有不同密度的数据中获得离群数据。(4)针对时序数据的规则挖掘,提出了基于聚类的规则挖掘算法,利用聚类获得用符号表示的时序序列,对符号化的时序序列进行规则挖掘;然后提出了一种基于模糊语义的时序规则挖掘算法;最后进行了时序数据中近似周期性规则挖掘的研究,在时序数据相似性的基础上进行周期性规则的挖掘。(5)深入地研究了时序数据的趋势挖掘,提出了一种基于小波变换的时序数据趋势挖掘算法,利用小波变换提取时序数据的多尺度的趋势序列,对时序数据的趋势

7、序列进行相似性挖掘,以获得具有相似运行趋势的时序序列。∥本文的时序数据挖掘算法是以建立的宝钢能源数据仓库为基础的,算法中使用的数据均来自宝钢能源数据仓库。通过时序数据挖掘算法的研究,能够获得能源数据中隐含的关于能源运行的规律,为生产管理提供有效的决策支持。关键字:数据挖掘,知识发现,数据仓库,时序数据,离群挖掘,相似催f规则挖掘ⅡResearchonTimeSeriesDataMiningBasedonDataWarehouseABSTRACTWiththerapiddevelopmentofcompute

8、rtechnologies,networkanddatastoragetechnique,largeamountsofdataarestored.Therapidgrowthdemandformanaginggrowingmountainsofdata,extractingandunderstandingusefulknowledgefromthesedataoutpacesthetraditionaldatab

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。