基于句子重述技术的中文文本摘要研究

基于句子重述技术的中文文本摘要研究

ID:36353591

大小:3.70 MB

页数:57页

时间:2019-05-09

基于句子重述技术的中文文本摘要研究_第1页
基于句子重述技术的中文文本摘要研究_第2页
基于句子重述技术的中文文本摘要研究_第3页
基于句子重述技术的中文文本摘要研究_第4页
基于句子重述技术的中文文本摘要研究_第5页
资源描述:

《基于句子重述技术的中文文本摘要研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着社会的进步和互联网技术的发展,互联网上信息以指数级别迅速增长,信息爆炸已经成为当今社会一个很严峻的问题。当潮水般的信息涌向人们时,传统人工处理信息的手段己经远远不能满足人们的需要。而自动文本摘要技术就是解决这一问题的有力工具之一.自动文本摘要是指利用计算机自动对文本编制摘要,是自然语言处理的重要应用领域之一。文摘是准确全面地反映某一文章中心内容的简洁连贯的短文,与索引相比更能满足信息获取的要求。自动文本摘要也是一项极具难度和挑战性的工作,人类已经对此进行了五十余年的探索。我国对自动文摘技术的研究目前还在初级阶段,但此技术所具有的重要作用是不可低估的,必将在未来的信息

2、处理领域得到广泛的应用。针对目前自动文本摘要的研究现状,本文首先使用基于统计的方法对文本进行特征统计,计算词和句子的权重,摘取出权值较高的句子。然后对这些句子应用了一种基于向量相似度计算的算法进行指代消解,同时也提出了一种新的句子向量相似度的计算方法去除冗余,最后利用启发式规则进行加工,从而得到文本摘要。本文在上述研究的基础上,设计了基于句子重述技术的自动文本摘要系统,实现了机器自动生成文摘的各个模块的功能。实验结果显示经过句子重述后的文摘具有较好的连贯性和流畅性,与修改之前的文摘相比较,文摘质量有明显提高。关键词:文本摘要;权重:相似度;重述;指代消解ABSTRACTAl

3、ongwimtheadvancementofsocietyandthedevelopmentoftheIlltcmcttcclmology,theinformationavailableontheWorldWideWebisgrowingexponentially,andtheinformationexplosionhasbeC.,omeaveryseriousproblemnowadays.Wheninformationemergepeopleliketidewater,thetraditionalmanualmeansofinformationprocessinghas

4、beenfarfrommeetingpeople'sneeds.Moreover,anautomatictextsummarizationsystemisoneofthepowerfultoolstosolvethisproblem.Ingeneral,automatictextsummarizationisdefinedastheprocessofabstractingadocumentautomaticallybyutilizingcomputer,anditisalsoregardedasoneofNLP(NaturalLanguageProcessing)’Simp

5、ortantapplications.Summarization伽lexpressthemainideaofanarticleaccuratdyandcomprehensively,itiscomposedofsomesuccinctandcoherentsentences.ComparedwiⅡlindex,summarizationcanmoresatisfytherequestofinformationaccess.Automaticabstractisofgreatdifficultiesandchallenges,andhasbeenexploredforabou

6、tfiftyyears.Researchofautomaticsummarizationofourcountryisinitsprimarystage,butthesignificantroleofthistechnologycannotbeunderestimated,anditmustbeextensivelyusedinthefutureofinformationprocessingarea.Aimingatthepresentresearchsituationofautomatictextsummarization,thispaperfirstanalyzesthe

7、documentusingthestatistic-basedmethod,gatherstheinformationoftextfeaturestatistics,calculatestheweightsofthewordsandsentences,andextractsthesentenceswithhigherweight.Followedbytheapplicationofanaphoraresolutionusinganalgorithmbasedonvectorresemblance,weremover

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。