基于浓缩数据立方的数据立方梯度挖掘研究

基于浓缩数据立方的数据立方梯度挖掘研究

ID:36355596

大小:3.13 MB

页数:103页

时间:2019-05-10

基于浓缩数据立方的数据立方梯度挖掘研究_第1页
基于浓缩数据立方的数据立方梯度挖掘研究_第2页
基于浓缩数据立方的数据立方梯度挖掘研究_第3页
基于浓缩数据立方的数据立方梯度挖掘研究_第4页
基于浓缩数据立方的数据立方梯度挖掘研究_第5页
资源描述:

《基于浓缩数据立方的数据立方梯度挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学博士学位论文基于浓缩数据立方的数据立方梯度挖掘研究姓名:刘玉葆申请学位级别:博士专业:计算机软件与理论指导教师:冯玉才20031109数据立方的挖掘算法GSCC。利用我们给出的问题形式化定义,与非实例化数据立方中约束性立方梯度挖掘问题进行了比较,指出了它们的不同之处在于两者的研究问题条件不同。前者给定的是已经计算好的数据立方,而后者给定的是用于动态计算数据立方元组的关系表。相似之处是两者的目的一样,都是发现感兴趣的梯度一探测元组对。通过具体例子详细地描述了GSCC算法过程。GSCC算法采用了排序和单元组部分扩展的优化技术。为了扩大算法处理问题的范围,给

2、出了GSCC算法在多种关系间的梯度、梯度元组约束条件、区间上的梯度、不同的梯度函数网个方面的扩展并与相关研究进行了比较,主要比较了我们研究的问题同相关研究问题的相似和不同之处。在合成数据集上对GSCC算法的性能进行了测试,测试结果表明了算法的有效性。在数据立方梯度查询语言方面,我们指出了现有梯度查询语言CubegadeQL查询空问大,效率低的不足并且提出了一种基于浓缩数据立方的新的梯度查询语言dmGQL语言。为了支持dmGQL语言查询,对立方梯度挖掘算法eLiveSet和GSCC做了一些修改,这些修改可以通过eLiveSet算法和GSCC算法输出部分的修改以及算法

3、的扩展来实现。基于eLiveSet和GSCC算法生成的数据立方元组个数,我们给出了dmGQL语言的一个查询代价模型。dmGQL语言查询处理过程包括语法分析、语义检查、查询计划、查询执行四个主要步骤。给出了查询语言物理上的优化技术即浓缩数据立方索引的结构。我们扩展国产的达梦数据库管理系统来实现dmGQL语言并且给出了需要扩展的功能模块,包括核心层需要扩展的七个模块以及API接口需要扩展的五个模块。在数据立方梯度挖掘工具方面,我们研究了在线分析处理与数据挖掘集成的在线分析挖掘系统OLAM系统。在分析了传统OLAM系统的不足之后,提出了在线梯度挖掘]二具OLGM。OLG

4、M系统采用了基于B/S模式的三层体系结构,包括客户端、应用层、数据服务层。OLGM系统的实现是基于ASP技术、COM技术以及dmGQL语吉。OLGM系统采用松散耦合方式与困产的达梦数据库管理系统集成。关键词:数据立方;浓缩数据立方;数据立方梯度挖掘:数据立方梯度查询;在线梯度挖掘儿AbstractAswemarchintotheageofdigitalinformation.wehaveseenanexplosivegrowthinthedatacollectionandhadvolumesofdata.HowtOextracttheusefulknowledge

5、fromthelargeandmultifariousdatahasbeenahotresearchtopic.Therefore,thedataminingtechnologyemergesasanewresearchcommunityandapplication.Theminingofdatacubegradientisanewandimportantresearchprobleminthedataminingcommunity.Itisanextensionofthetraditionalassociationrulesmininginthedatacube

6、.Cubegradientsaresignificantlymoreexpressivethanassociationrulesincapturingtrendsandpatternsindatabecausetheyusearbitraryaggregatemeasures.CubegradientCanalsosupportsophisticated“whatif’analysistasksdealingwithbehaviorofarbitraryaggregates.Assuch,cubegradientcanbeusefulinmarketing,sal

7、esanalysis,finance,manufacturing,governmentandmilitaryaffairsetc.Surroundingthethreekeyproblemsoftheminingofdatacubegradient,i,e.theminingalgorithm,thequeryofcubegradientandtheminingtool,thefollowingfourworkshavebeendone:theresearchoftheconstrainedcubegradientmining,theresearchoftheco

8、nstrN

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。