欢迎来到天天文库
浏览记录
ID:6794428
大小:372.00 KB
页数:40页
时间:2018-01-25
《毕业设计(论文)-基于java的校园在线订餐网站的设计和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、南京邮电大学通达学院毕业设计(论文)题目:新闻自动摘要系统设计与实现专业:软件工程学生姓名:班级学号:指导教师:指导单位:计算机学院、软件学院__日期:2014年12月1日至2015年6月12日摘要当今世界瞬息万变,每天都会产生数量庞大的新闻,而且随着Internet的不断发展,传统媒体逐渐向网络靠拢,网络上的信息资源增长迅猛。如何在海量的新闻资源中快速找到人们感兴趣的信息,获取信息的主旨,已经是一个迫在眉睫的问题。人们迫切需要一个可以对大量新闻信息进行提炼、压缩的工具,自动文本摘要技术由于其可以提炼浓缩文本,减小用
2、户的浏览压力,同时又可以为其他文本技术提供支持,因而得到了广泛的关注。本文的主要研究目标是新闻文本的自动摘要技术,在参阅了学术界相关摘要算法的基础上,着重使用了新闻文本的外部特征和TF-IDF算法来进行单新闻文本和多新闻文本的摘要生成。课题中引用了英文语言处理工具StanfordCoreNLP进行新闻分词、分句和单词的词形还原,采用Java语言在Eclipse平台上设计实现了新闻自动摘要系统。关键词;自动摘要;TF-IDF;词语权重计算;特征信息提取;余弦相似性IVABSTRACTNowadays,theworldi
3、schangingallthetime,wecanhaveahugeamountofinformationnewseveryday,andwiththecontinuousdevelopmentofInternet,traditionalmediagraduallymoveclosertothenetwork,informationresourcesonthenetworkhasincreasedrapidly.Howtofindtheinterestedinformationinthevastnewsresourc
4、es,getthegistofinformation,hasbeenapressingissue.Thereisanurgentneedforalargenumberofnewsandinformationcanberefined,compressiontools,automatictextsummarizationtechnologybecauseofitsconcentratedextracttextcanreducetheuser'sbrowsingpressure,butalsoprovidessupport
5、forothertexttechnology,whichhasbeenwidespreadconcern.Themainobjectiveofthispaperisautomaticsummarizationtechnologyofnewstext,afterconsultingrelatedsummarytechnologyonthebasisofthealgorithmintheacademic,itemphasizesontheuseoftheexternalfeaturesofnewstextandTF-ID
6、Falgorithmtogeneratethesummaryofsinglenewstextandmulti-documenttext.TheprojectcitedEnglishlanguageprocessingtoolsStanfordCoreNLPtotokenizesthetext,splitsasequenceoftokensintosentences,andgeneratesthewordlemmasforalltokensinthecorpus.Wedesignandimplementthissyst
7、eminJavaontheEclipseplatform.KeyWords:AutomaticTextSummarization;TF-IDF;Term-weighting;Featureinformationextraction;CosinesimilarityIV目录第一章绪论11.1课题研究背景和意义11.2课题研究现状11.2.1单文本自动摘要11.2.2多文本自动摘要21.3论文的组织结构4第二章技术介绍52.1文本摘要技术的介绍52.1.1文本摘要的分类52.2文本摘要的方法52.2.1自动摘录52.2.
8、2基于理解的自动文摘62.2.3信息抽取62.2.4基于结构的自动文摘72.3自动文摘评价72.3.1内部评价方法72.3.2外部评价方法82.4基于文档外部特征提取的自动文摘算法82.4.1文本预处理92.4.2词语、句子权重计算92.4.3句子相似度计算102.4.4文摘句提取及文摘输出112.5斯坦福工具包介绍122.6本章小结12第三章
此文档下载收益归作者所有