数据流聚集查询和频繁模式挖掘的研究

数据流聚集查询和频繁模式挖掘的研究

ID:20645009

大小:2.66 MB

页数:77页

时间:2018-10-14

数据流聚集查询和频繁模式挖掘的研究_第1页
数据流聚集查询和频繁模式挖掘的研究_第2页
数据流聚集查询和频繁模式挖掘的研究_第3页
数据流聚集查询和频繁模式挖掘的研究_第4页
数据流聚集查询和频繁模式挖掘的研究_第5页
资源描述:

《数据流聚集查询和频繁模式挖掘的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要数据流模型的出现对传统的数据管理技术提出了巨大的挑战,由于数据的流动性和无限性等特点,已有的数据库技术无法对数据流数据进行有效的管理,因此,必须进行数据流管理新技术的研究。数据流管理技术已经引起了数据库界的广泛关注,成为当前的一个研究热点。研究数据流相关技术不仅有重要的学术价值,而且在传感器网络、气象监测与分析、移动物体位置跟踪、股票分析、邮件过滤、网络监控与安全等领域有着巨大的应用前景.本文对数据流管理系统和数据流挖掘中的若干关键问题进行了深入探索,主要有以下内容:(1)数据流管理系统的体系

2、结构:面向高速数据流,提出了一个基于硬件预处理的数据流管理系统体系结构。目前已有的原型系统都是从查询优化、系统调度等方面来提高数据的处理速度,在高速数据流环境下都存在明显的不足,因此,本文从一个全新的角度构建新一代数据流管理系统,在体系结构上采用软硬件协同的思想和前端硬件预处理技术,实现数据的高速处理。(2)高速数据流聚集查询:目前已有的聚集算法绝大多数是采用近似技术,以牺牲精度来换取速度的提高。随着硬件技术的快速发展和硬件成本的迅速下降,软硬件协同技术逐渐引起了人们的关注.本文提出了一种软硬件协

3、同的高速数据流聚集查询方法,发挥了硬件在处理速度上的优势和软件在灵活性方面的长处,也研究了提高查询资源共享度的方法。(3)分布式数据流增量聚集查询:分布式处理是数据流管理系统发展的必然趋势。而在分布式系统中,传输量往往是系统的主要瓶颈,因此,本文研究并提出了一种分布式数据流增量聚集方法,可以显著地降低系统的通信量。(4)数据流频繁闭合模式:频繁闭合模式能够唯一地决定所有的频繁模式及其准确的支持度,并且往往数量比频繁模式小几个数量级,在实际中更容易理解和应用。本文研究了动态数据流环境下的频繁闭合模式

4、挖掘,目前还很少有这方面的研究报道。滑动窗口和界标窗口是数据流环境下两种最重要的窗口类型,本文分别研究并提出了基于滑动窗口和基于界标窗口的数据流频繁闭合模式挖掘新算法,算法具有较好的适应性和可扩展性,用户可以根据需要,通过调整允许误差在执行效率和结果精度方面取得平衡。(5)数据流变化检测:在数据流环境下,模式的改变往往比正常模式提供更多有价值的信息,因此,数据流变化检测是数据流挖掘的核心问题之一。本文运用信息熵理论,从频繁项集角度出发,提出了一种基于最大频繁项集信息熵的数据流变化检测方法,不仅可以

5、反映关联规则挖掘中频繁模式的变化,而且也可以有效地反映数据集的改变。关键字:数据流;系统结构;聚集查询;软硬件协同;分布式系统;频繁闭合模式;变化检测AbstractTheappearanceofdatastrealnmodelsisbringinggreatchallengestotraditionaldatamanagementtechnology.Becauseoffeaturesoffluidltyandinfinity,theexistingdatabasemanagementtechn

6、iquescanhardlybeappliedtoprocessdatastreamseffectively.Therefore,it’snecessarytostudythenewdatastreammanagementtechniqueswhichhavearrestedalotofdatabaseresearchers’attention.Datastreamprocessingisbecomingahotspotresearchissue.Tostudydatastreamshasneto

7、nlyimportantscientificvaluebutalsohugeapplicationoutlooks,suchassensornetworks,weathermonitoringandanalysis,mobileobjecttracking,stockanalysis,mmlfiltering,networkmomtoringandsecunty,andsOon.Intinspaper,weexploreafewptinclpalproblemsovfffdatastreamsma

8、nagementsystemanddatamining.indepththenK∞contentsareasfollowing:(1)SystemArchitectureofDataStreamManagement:facingt0thedatastreamswithhighmte,anewdatastreammanagementsystemarcintectarebasedellhardwarepreprocessingisproposed.Inexistingdatastrea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。