基于mapreduce和rough集理论的海量数据属性约简方法研究

基于mapreduce和rough集理论的海量数据属性约简方法研究

ID:32966029

大小:6.51 MB

页数:69页

时间:2019-02-18

基于mapreduce和rough集理论的海量数据属性约简方法研究_第1页
基于mapreduce和rough集理论的海量数据属性约简方法研究_第2页
基于mapreduce和rough集理论的海量数据属性约简方法研究_第3页
基于mapreduce和rough集理论的海量数据属性约简方法研究_第4页
基于mapreduce和rough集理论的海量数据属性约简方法研究_第5页
资源描述:

《基于mapreduce和rough集理论的海量数据属性约简方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆邮电大学硕士学位论文论文题目基王丛塑趔丛鳇盘&堕曲塞=璺逾的海量数据属性约简方法研究英文题目一ResearchonMethodsofAttributeReductionfor—MassiveDataBasedonMapReduceandRou吐SetTheory硕士研究生隘坚壤指导教师扬耍割挫一.学科专业.让簋抠应用挞一一.论文提交日期2Q22主墨且论文答辩日期2Q12生5且2§互论文评阅人2012年5月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获

2、得重麽由&电太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:知fz,年乡月哆日学位论文版权使用授权书本学位论文作者完全了解重麽由&电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重迭由Ⅸ电态堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)⋯一虢防7哆礞签字日期:切门年岁月彳日导师躲杨乒签字日期:沙/湃厂月哆日重庆邮电大学硕

3、士论文摘要随着社会网络化和信息化的迅猛发展,在许多领域积累了海量的数据,如何降低这些数据的维度,从中选择出有用的特征,一直是海量数据挖掘的重要研究课题。基于Rough集理论的属性约简是一种有效的数据约简和降维方法,它能在尽可能保证数据分类能力不变的情况下有效降低数据的维度、选择最有用的特征。然而,经典的Rough集属性约简方法对大数据的处理能力有限、效率不高,不能适应海量数据挖掘的应用需求,因此,研究基于Rough集的海量数据属性约简,能拓展粗糙集理论的应用,具有重要的研究价值。云计算的兴起,为海量数据挖掘带来了新的思路,目前云计算技术已成为海量数据挖掘的高效解决方案。采用云计算技术进行海量数

4、据挖掘的关键在于设计能运行于云计算平台的并行数据挖掘算法。本文将目前主流的云计算并行编程模型MapReduce与Rough集的理论相结合,针对海量数据的属性约简问题,围绕并行属性约简的关键技术进行了研究,取得的研究成果如下:(1)提出了基于MapReduce和Rough集理论的并行正区域计算算法。本文在分析正区域求解过程可并行性的基础上,结合MapReduce的并行思想,提出了基于MapReduce的并行正区域计算方法,提高了对大规模数据集计算正区域的效率。(2)提出了基于MapReduee和Rough集理论的并行属性核计算算法。本文在并行计算正区域的基础上,研究了属性核计算过程中条件属性之间

5、和判断每个条件属性是否为核属性两个层面的并行方式,提出了基于MapReduce的并行属性核计算方法,并通过仿真实验,验证了该方法对大规模数据的高效处理能力。(3)提出了基于MapReduce和Rough集理论的并行属性约简算法。本文在基于MapReduce的并行属性核计算算法的基础上,研究了计算属性重要性过程和判断属性集是否是一个约简的并行性,提出了基于MapReduee的并行属性重要性计算算法和并行属性约简算法。对比实验结果显示了该算法的高效性。(4)设计了一个基于Hadoop云计算平台的海量数据挖掘原型系统。本文最后基于Hadoop开源云计算平台,设计了一个海量数据挖掘的原型系统。系统实现

6、了基于B/S架构进行海量数据并行属性约简等功能,并具有良好的可扩展性。关键词:属性约简,Rough集,MapReduce,正区域,属性核垩塞塑皇奎堂堡主笙文Abstract————————————————————————————————————————————————一:::=二:Abs仃actWiththerapiddevelopmentofnetworkingandInformatizationforthesociety,massivedataisaccumulatedinmanyfields.Itisalwaysanimportantresearchtopicforthemassived

7、ataminingthathowtoreducedatadimensionandselectusefulf.eatIlres.AttributereductionbasedonRoughsettheoryisaneffectivemethodfordatareductionanddimensionreduction.ItCaneffectivelyreducedatadimensionandsel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。