基于云计算的多层次文本关键词抽取研究与应用.pdf

基于云计算的多层次文本关键词抽取研究与应用.pdf

ID:50414195

大小:10.33 MB

页数:67页

时间:2020-03-05

基于云计算的多层次文本关键词抽取研究与应用.pdf_第1页
基于云计算的多层次文本关键词抽取研究与应用.pdf_第2页
基于云计算的多层次文本关键词抽取研究与应用.pdf_第3页
基于云计算的多层次文本关键词抽取研究与应用.pdf_第4页
基于云计算的多层次文本关键词抽取研究与应用.pdf_第5页
资源描述:

《基于云计算的多层次文本关键词抽取研究与应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、MASTE民DISSERTATION论文题目;基于云计算的多层次文本关键词...,瞧説:,,戴nl麵国内图书分类号:TP391.1密级:公开国际图书分类号:004西南交通大学研究生学位论文基于云计算的多层次女本关键词抽取研究与应用年级二〇〇屯姓名王博申请学化级别工学硕±专业计算机系统结构指导老1!币戴齐副教授二零一五年十一月十四日ClassifiedIndex:TP391JU.D.C:004SouthwestJiao1;ongUniversityMasterDe

2、greeThesisRESEARCHANDAPPLICATIONOFTEXTMULTI-LEVELKEYWORDEXTRACTIONBASEONCLOUDCOMPUTINGGrade:2007Candidate:WanBogAcademicDegreeAppliedfor:MasterSpeciality:ComputerSystemArchitectureSupervisor;AssociateProfessorDaiQiNov.14th2015,西南交通大学学

3、位论文版权使用授权书本学位论文作者完全了解学校有关保留,、使用学位论文的规定同意学校保留并。向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅本人授权西南交通大学可将本论文的全部或部分内容编入有关数据库进行检索,可采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于1.保密□,在年解密后适用本授权书;2.不保密因,使用本授权书。"小(请在上方框内打)学位论文作者签名:指导老师签名..王日期;wr/.日期;;/作西南交通大学硕±学位论文主要工作(贡献)声明本人在学位论文中所做的主

4、要工作或贡献如下:1、对低层次的基于词频的文本关键词抽取进行研究并进行并行化改进,针对Hadoop云计算平台的特点设计Map、Combine、Reduce函数实现云计算平台下基于词频的文本关键词抽取,将词频最富的词语作为基于词频的文本关键词抽取结果;2、对较高层次的基于语义相似度的文本关键词抽取进行研究并进行并行化改进,,Hadoo云计算平台的特点设计Ma、Combine采用现有的语义相似度计算方法针对pp、Reduce函数实现云计算平台下基于语义相似度的文本关键词抽取,将与其他所有词语语义相似度和最高的词语作为基于语义相似度的文

5、本关键词抽取结果:3、对更高层次的基于语言网络的文本关键词抽取进行研究并在Hadoop云计算平-R台下借助XIME网络分析工具实现了对语言网络的作为节点的词语的PageRank值计算,虚拟的超级节点的引入可W确保语言网络是连通的,将语言网络中做为节点的词语PageRank最高的词语作为基于语言网络的文本关键词抽取结果;4、在云计算平台下将低层次的基于词频的文本关键词抽取、较高层次的基于语义相似度的文本关键词抽取、更高层次的基于语言网络的文本关键词抽取结果融合起来,采用非线性融合函数,取词频平方根、语义相似度和、PageRa化值平方

6、H者乘积最高的词语作为多层次文本关键词抽取结果,实验结果证实了基于云计算的多层次文本关键词抽取的有效性。,是在导师指导下独立进行研究工作所得的成本人郑重声明:所呈交的学位论文果,。除文中己经注明引用的内容外本论文不包含任何其他个人或集体己经发表或撰写过的研巧成果。对本文的研究做出贡献的个人和集体,均己在文中作了明确说明。一切法律责任将由本人承担本人完全了解违反上述声明所引起的。学位论文作者签名:一.'曰期:7Wr./乂西南交通大学硕±研究生学位论文摘要经济与科技的高速发展及信息化的加速推进使当今社会己逐步迈

7、进云计算时代,云计算与大数据的深度结合对传统行业带来巨大的冲击。传统技术需要在云计算环境中重新进行分析、设计,充分挖掘云计算的潜力,为传统行业的变革寻求新的契机。自然语言处理是计算机科学领域与人工智能领域等其他领域的重要研究内容。自然,主要包括词法分析语言处理从不同的层次来讲、句法分析、语义分析、文本生成、机器翻译及关键词抽取等,已有部分技术得到成功的。自然语言处理经过长期的发展应用,如中文分词工具,包、翻译软件等。由于计算复杂度高或者其他方面的原因括一直W来进展缓慢句法分析、语义分析在内的高层次自然语言处理,云计算及大数据技

8、术的逐渐成熟及应用的日益普及为解决文本关键词抽取等自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。