欢迎来到天天文库
浏览记录
ID:35059835
大小:3.95 MB
页数:72页
时间:2019-03-17
《基于云平台的知识专家图谱的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一:..户皆.M.;刊i'芭一扣-':;...后?;-,.%I5」r-;.-VTF-^密.r.:?.-4..確片e式v》.每.為J遷^^緣节-.::-u.l,^,i典?义女7?聲.起4F.A'及T:r裙占今V單-學-i-芋許;;-\、.:.^..f;>'..&.::;r;;義自■,:.;、.乃,,:;;再■n、'.;;巧..tV;,'<:;F、.k.货马ig题im齡专龍啊究1;.-.f.r.:/-.^'!.已1—.薰:鑛辛.匈.ff;芽.学号§n乃;谤>:姓.名r;1.
2、聲巧师;导章t每.4V窜...专^位IU贈/王'.■Tk类型全園摘乂V^.专专业领P皿I'论交?I二巧月,rV.;.:'CT-袁萬r?长%若4%義严.V>y,\/零JT:卢弟!:豪.7:品砖南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进斤的研究T.作及取得的研究成果=尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证
3、书而使用过的材科。一工文示。与我同作的志对本究所做的任何献均已在论中作了明确的说明并表了谢意同研贡一。人及及不,意承切相的法任本学位论文涉相关资料若有实愿担关律责-研生签:化為;究名日期南京邮电大论文使用授权声明学学位可W口送论的印和电子文本人授权南京邮电大学保留并向国家有关部或机构交文复件:文查和可W文全部或据进行档允许论被阅借阅;将学位论的部分内容编入有关数库检索;可W采影印、或等、汇论。子文和纸质用缩印扫描复制手段保存编本学位文本义电档的内容一理致。()尘院。论文的内容相论文的公布包括刊登授权南京邮电大学研究办密论
4、文后。涉学位在解密适用本授权书 ̄口'?生:::/研究签名签日^6名导师名期1MiningMechanismofKnowledgeClustersandAssociationsBasedCloudPlatformThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByXuHaoSupervisor:Prof.ZhangYunMay2016摘要随着科学的发展和工程水平的提高,互联网数据量也在增长,传统单机处理
5、方式已经不能满足,对于网站整体运行情况的分析有了更多的分析角度和更精确的分析方法,本选题的研究目的即从一种更优的视角出发。大数据时代背景下,各种文本数据正大量地出现在人们的日常生活中,本文针对文本摘要、参考文献、关键词等多维度数据挖掘,进行整理推荐文本信息,以便提高读者阅读效率与质量。本文整体思想是先对文本进行静态聚类,使得文本信息自动归档,再基于用户动态的浏览过程做关联规则分析,得到动态文本数据频繁项集,最后将频繁项集在聚类结果中分析找到其关联规则,以提高文本信息查询的效率,具有非常重要的应用前景与研究意义。引用Hadoop实验环境平台,在现有的聚类算法基
6、础上做出改进,提出了一种基于权值矩阵的FP-Growth关联规则,通过改进的关联算法对文献作者信息挖掘过程的处理时间及隐含信息的挖掘程度等指标进行实验,改进算法性能和时空间效率,最终得到更有效、更精准的频繁项集,以及通过改进了的K-means聚类算法,找出相互关联的文献作者,获得参考文献作者的知识专家图谱。关键词:数据挖掘,云平台,聚类,关联规则,大数据IAbstractWiththeimprovementofthescienceandengineering,theInternetisalsogrowingamountofdata.Thetraditiona
7、lstand-aloneapproachcannolongermeetfortheoveralloperationofthesiteanalysis.Underthebackgroundofbigdata,varioustextdatamassivelyinpeople'sdailylives.Thispapertextsummary,references,keywordsandothermulti-dimensionaldataminingcollaterecommendedtextinformationinordertoimprovetheefficie
8、ncyandqualityofreaders.The
此文档下载收益归作者所有