欢迎来到天天文库
浏览记录
ID:38688914
大小:1.53 MB
页数:9页
时间:2019-06-17
《项目实战教程数据挖掘工具》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Hadoop大数据解决方案进阶应用Hadoop讲师:迪伦(北风网版权所有)Mahout数据挖掘工具(4)ApacheMahout优点Mahout安装Mahout测试课程目标ApacheMahout优点技术社区活跃良好的扩展性和容错性文档化好,实例丰富100%源代码开源易于使用Mahout安装下载:http://mirror.bit.edu.cn/apache/mahout/0.9/上传并解压Mahout安装环境变量配置,修改.bashrc,添加如下内容:使配置生效$source.bashrc几个
2、重要的环境变量JAVA_HOMEMAHOUT_JAVA_HOMEHADOOP_CONF_DIRMAHOUT_LOCALMAHOUT_CONF_DIRMAHOUT_HEAPSIZEMahout安装验证安装Mahout测试下载测试数据$wgethttp://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data启动hadoop集群$start-dfs.sh$start-mapred.sh上传测试数
3、据到HDFS$hadoopfs-mkdirtestdata$hadoopfs-putsynthetic_control.datatestdataMahout测试运行k-means算法$mahoutorg.apache.mahout.clustering.syntheticcontrol.kmeans.Job启动12个MapReduceJob任务欢迎访问我们的官方网站www.ibeifeng.com
此文档下载收益归作者所有