mapreduce学习日志之我的mapreduce程序学习

mapreduce学习日志之我的mapreduce程序学习

ID:32821073

大小:57.54 KB

页数:3页

时间:2019-02-16

mapreduce学习日志之我的mapreduce程序学习_第1页
mapreduce学习日志之我的mapreduce程序学习_第2页
mapreduce学习日志之我的mapreduce程序学习_第3页
资源描述:

《mapreduce学习日志之我的mapreduce程序学习》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、MapReduce学习日志之我的MapReduce程序学习将一批电话通信清单,记录了用户A拨打用户B的记录,需要做一个倒排索引,记录拨打给用户B的所有用户A。如原有的txt为:13999999991389999999129999999913722222221880000666137222222218944444441608612613800138000138001380601261638616086首先,我们应该把源文件传到Hdfs上,然后将原始数据进行分割,将被叫作为KEY,主叫作为Value,W拨打相同被叫的主叫

2、号码汇总起来输出到HDFS。程序如下:packagecom・xxs;importjava.io.IOExccption;importorg・apache・hadoop・conf・Configuration;importorg・apache・hadoop・conf.Configured;importorg・apache・hadoop.fs.Path;importorg.apache,hadoop.io.*;importorg.apache,hadoop・mapreduce・*;importorg・apacho.hado

3、op・mapreduce・lib・input・FilcInputFormat;importorg・apache・hadoop・mapreduce.Lib・output・FileOutputFormat;importorg.apache,hadoop・mapreduce-lib・output・TextOutputFormat;importorg・apache・hadoop・uti1・Tool;importorg.apache,hadoop.util.ToolRunncr;//此处为导入的包,一般为固定的。publicc

4、lassMapTcst_2extendsConfiguredimp1ementsTool{enumCounterLINESKIP,}〃出错的行,出错计数器publicstaticclassMapextendsMappcrpublicvoidmap(LongWritablekey,Textvalue,Contextcontext)throwsIOException,InterruptedException{Stringline=valuc・toString();

5、try{String[]lineSplit=line.splitC”);Stringanum=lineSplit[0];Stringbnum=lincSplit[1];context,write(newText(bnum),newText(anum));}catch(java・lang・ArraylndexOutOfBoundsExceptione){context.getCounter(Counter.LINESKIP).increment(1);return;}publicstaticclassReduceext

6、endsReducer{publicvoidreduce(Textkey,Iterablevalues,Contextcontext)throwslOException,InterruptedException{StringvalueString;Stringout=,,,/;for(Textvalue:values){va1ueString=va1ue・toStringO;out+=valueString+z,";}context.write(key,newTe

7、xt(out));publicintrun(String[]args)throwsExceptionConfigurationconf=getConf();Jobjob=newJob(conf,,/MapTest_2,/);//任务名job・setJarByClass(MapTest_2・class);//指定classFilelnputFormat.addInputPa?/?(job,newPath(args[0]));//输入路径FileOutputFormat.setOutputPa?/?(job,newPat

8、h(args[1]));//输出路径job.setMapperClass(Map・class);job・setReducerClass(Reduce・class);job.setOutputFormatClass(TextOutputFormat.class);job・setOutputKeyClass(Text,class);job・setO

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。