基于Hadoop2.0的数据挖掘算法并行化研究.pdf

基于Hadoop2.0的数据挖掘算法并行化研究.pdf

ID:50423533

大小:8.46 MB

页数:75页

时间:2020-03-05

基于Hadoop2.0的数据挖掘算法并行化研究.pdf_第1页
基于Hadoop2.0的数据挖掘算法并行化研究.pdf_第2页
基于Hadoop2.0的数据挖掘算法并行化研究.pdf_第3页
基于Hadoop2.0的数据挖掘算法并行化研究.pdf_第4页
基于Hadoop2.0的数据挖掘算法并行化研究.pdf_第5页
资源描述:

《基于Hadoop2.0的数据挖掘算法并行化研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、..?,:一:::?、:3V.〕.:、,:V*:.?V,m臂:-,:£f&-.等;p¥J.,?p/,..t%,,■.<j:.,^x、..^/-r^,.i-翁-:-等.:\0.v,...:.::.-:^馬i’:一Y/?■l?>.:--u上^知我.l:.^:.1-’秘J代y:.费-^.,g:奶\v..vc‘-lr:v_,.:.ir.;士^文.:)广v、v,/:.-."■H.,^七..“:/::?;._、^”;暴r”..】..l:‘二,y,..、V#囊:5_-i-Vi.4、"^‘;H_■■;r"」丨:

2、:..,"..,:S于H^ooi&.■的撤家e?.^^:卞-〕xr”.并七研::/.、讀f"'一,.:-私"f、"■1..-各-i-,、、:■:;,:-:,|.,、In.幾...^^x.士.^“,,M.i3v‘.善..免,“^I^.;f,,-..:^管J/if3rt..V.■.!"V、.:-.&...?.,.,.-::■,:\.u.?|/(r:,#::‘.;,,.,..y::.:、“‘?:viA义.…■.v二.;‘^?、碎..\:::,.-w:s.:_.、>i纖

3、二.*.Mr:,k..:T..1讀.>7^錢.fM-^Hx'M.:.5l/Sr::l%T:;參...v.v(f.;、/.」.>d4,r£.■.-.梟,藝■?>!:‘.I..、■;”:/J、',;v、...』資,;;.餐.s:”、.:f,■’■::.c沒,:-I.v.歲、T,-、.,1,..卞:-德.4、f、/...,广、.VK楼,二....?k”.i.:■:ki/f.、r/V,'‘rA.f澤.‘*在f-/”:.:.,...s.■iil、1l/f3,:>^lI,

4、B./--.,。vt〈l”./,.¥:fi5>.r.辨“:五,:M^.h■:.:.n..^?l、,?...■■K■i..f.’.:S,上.:::一,..l權x.:..K、■s「.p‘-l?.:麟.、—.VJ厂..“...s“‘。:i:v”土.、1.(.T..”一"l,.,纖>aki::_)分类号:学校代号:11845UDC:密级:学号:2111204201广东工业大学硕士学位论文(工程硕士)基于Hadoop2.0的数据挖掘算法并行化研

5、究瞿卓指导教师姓名、职称:章云教授专业或领域名称:控制工禾呈学生所属学院:自动化学院论文答辩日期一:二〇五年五月ADissertationSubmittedtoGuandonUniversitofTechnologgygyfortheDereeofMastergMasterofEnineerin(gg)T'heresearchonDataMininAlorithmsggParalleliationBasedonHadoo2.0pCandidate:QuZhuoSupervisor:Prof

6、.ZhangYunMa2015ySchoolofAutomationGuangdongUniversityofTechnologyGuanzhouGuandon,.R.China,510006g,ggP^摘要当今社会正在经历一场重大的时代变革,以互联网行业为代表的各行各业正被铺天盖地的庞大数据所覆盖,尤其是社交网络、电子商务和移动通信将人们带入了“”一个以PB级为单位的数据信息新时代。在这个大规模生产、分享和应用数据的"”云计算一时代里,以技术为核心结合了数据挖掘、人工智能等系列技术的整体“”方案成为了我们解决大数据难题

7、。、发掘数据价值、征服数据海洋的巨大动力H一^adoop平台是ApacheSoftwareFoundation旗下的开源分布式系统。它的软件库是一个允许使用简单的编程模型对集群计算机内的大数据集进行分布式处理的一框架,它设计成可以从单服务器纵向扩展到成千上万的服务器,而其中的每个服务器都提供本地计算及存储。它不依靠硬件来提供高可用性,软件库本身具有能够检测和处理应用层的错误的能力,因此

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。