关联规则挖掘中的mapreduce并行架构与隐私保护研究

关联规则挖掘中的mapreduce并行架构与隐私保护研究

ID:35045673

大小:6.71 MB

页数:72页

时间:2019-03-17

关联规则挖掘中的mapreduce并行架构与隐私保护研究_第1页
关联规则挖掘中的mapreduce并行架构与隐私保护研究_第2页
关联规则挖掘中的mapreduce并行架构与隐私保护研究_第3页
关联规则挖掘中的mapreduce并行架构与隐私保护研究_第4页
关联规则挖掘中的mapreduce并行架构与隐私保护研究_第5页
资源描述:

《关联规则挖掘中的mapreduce并行架构与隐私保护研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:10004密级学校代码:公开又道乂肇BEIJINGJIAOTONGUNIVERSITY硕±学位论文胃m关联规则挖掘中的MapReduce并行架构与隐私保护研究作者姓名\熊富蕊学科专化计算机科学与技术'指导教师桑应朋副教授'v>^培养院系化算化与信息技术学慌f*1MrTf^gs■3內巧刊f’''-一^'K?■■想巧它(K、謝f_.\,、riy1如'交道乂#硕±学位论文关联规则挖掘中的Map民educe并行

2、架构与隐私保护研究民educe-based民e化archonMaParallelArchi化ctureandPrivacpyPro化ctioninAssociationRuleMining作者:熊富蕊导师:桑应朋北京交通大学2016年6月1学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,、提供阅览服务,并采用影印缩印或扫描等复制手段保存、汇编供査闷和借阅。同意学

3、校向国家有关部口或机构送交论文的复印件和磁盘。学校可为存在馆际合作关系的兄弟离校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:富交导师签名;自!^<<、签字曰期:如年月巧签字曰期:又年^月>2曰II::学校代码10004密级公开北京交通大学硕±学位论文关联规则挖掘中的MapReduce并行架构与隐私保护研究-badPara民e化archonMaHeducesellelArchitectureandPrivacpyPro化ction

4、inAssociationRuleMining13120436作者姓名;熊富蕊学号:导师姓名;桑应朋职称:副教授学位类别:硕±:工学学位级别学科专业:计算机科学与技术研究方向:数据挖掘北京交通大学2016年6月ill致谢首先,感谢我的导师。从选题到论文研巧工作的完成都是在老师的亲切关怀和悉必指导下完成的一直孜孜不椿地指导。H年的研巧生生活,老师言传身教,着我的学习和生活。老师渊博的学识、精益求精的工作作风、严谨的治学态度和严UA律己、宽W待人的崇尚风范,深深地影响了我,

5、不仅使我掌握了研究方法,还使我明白待人处事的道理。我谨向老师表达我的敬意之情和最由衷的感谢。感谢北京交通大学研巧生部、计算机与信息技术学院、全体老师和班级学生。、学习让我可W在这个团结、友好的环境里,安也,开阔眼界,在面对困难时,能够有信也继续学习并快乐的渡过研巧生生活。感谢实验室的师姐妹,营造出了良好研究氛围。在生活中的支持与信,并帮助和鼓励我能够快速的完成课题的研巧,任,让我可W自信的面对挫折和困难最后特别感谢我的父母,感谢他们养育我成人,教会我做人。对我的理解与支持和无微不至的关怀,是我人生道路上不

6、断前进的动力,使我不断的成长,不断挑战自己并完成人生目标。、感谢所有给予我关也、指导和支持的人们!iv北京交通大学硕±学位论文摘要摘要随着信息网络技术的快速发展,全球数据量呈现爆炸式増长,如何从海量数据中快速的挖掘出有用信息是当今社会亟待解决的问题。关联规则是数据挖掘中一个非常重要的技术,被广泛的应用于各个领域。如何使用关联规则正确地挖掘是数据挖掘的首要任务,也是本文的研究重点。由于传统关联规则算法在挖掘海量数据时,效率较低且大多会出现内存不足的现象,而并行技术可W髙效处理海量数据,因此,并

7、行关联规则算法的研巧具有重大实际意义。同时,随着数据挖掘技术的不断提高,用户的隐私可能会遭到泄露,实现数据的隐私保护也是必要的。因此,本文针对隐私保护和海呈数据挖掘问题,提出了基于隐私保护的并行PRRCHA算法和基于MapReduce的并行MRFP算法。本文的主要研巧工作如下;(1)传统的Apriori算法需要生成大量的候选项目集,并且对计算机内存要求较高。针对Apriori算法的这些缺点,本文提出了基于MapReduce的并行PCHA算法。首先对Apriori算法采用比较方法和hash树结构优化得到CHA算法,

8、简化了最大频巧项目集的生成步骤,减少了候选项目集的生成数目,并精确地获得所有频巧项目集。其次,利用MapReduce编程模式分析CHA算法的频巧模式挖掘过程,进行数据的独立分组,保证算法的完备性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。