欢迎来到天天文库
浏览记录
ID:33506132
大小:1.91 MB
页数:63页
时间:2019-02-26
《基于hadoop的高性能文本聚类算法的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号密级UDC编号10736硕士学位论文基于Hadoop的高性能文本聚类算法的设计与实现研究生姓名:林纪坡指导教师姓名、职称:杜小妮教授专业名称:软件工程研究方向:信息安全二零一三年五月DesignandImplementionofhighperformancetextclusteringalgorithmBasiconHadoopLinJiPo西北师范大学研究生学位论文作者信息论文题目基于Hadoop的高性能文本聚类算法的设计与实现姓名林纪坡学号2011221171专业名称软件工程答辩日期2013-5-25联系电话15136217986E_ma
2、illinjipo@gmail.com通信地址(邮编):甘肃省兰州市西北师范大学计算机科学与工程学院(730070)备注:目录摘要...............................................................IAbstract..........................................................II1绪论.............................................................11.1课题的研究背景和意义..
3、.......................................11.2课题研究的动机和目的.........................................21.3论文的主要内容...............................................31.4论文的组织和结构.............................................32文本聚类算法综述.................................................52.1聚类的定义
4、...................................................52.2聚类算法的性能要求...........................................52.3文本聚类及其一般流程.........................................62.4文本聚类相关技术.............................................72.4.1中文分词...............................................7
5、2.4.2文本表示...............................................82.4.3文本相似度计算.........................................92.4.4类间距离度量..........................................102.5文本聚类算法................................................102.5.1基于划分的聚类算法....................................11
6、2.5.2基于层次的聚类算法....................................112.5.3基于密度的聚类算法....................................122.5.4基于网格的聚类算法....................................132.5.5基于模型的聚类算法....................................132.6本章小结...................................................143Hadoop平台
7、概述..................................................153.1云计算平台概述..............................................153.2分布式系统概述..............................................153.3Hadoop分布式系统...........................................153.4Hadoop总体架构...................................
8、..........163.5Hadoop分布式文件系统—HDFS............................
此文档下载收益归作者所有