欢迎来到天天文库
浏览记录
ID:36353591
大小:3.70 MB
页数:57页
时间:2019-05-09
《基于句子重述技术的中文文本摘要研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要随着社会的进步和互联网技术的发展,互联网上信息以指数级别迅速增长,信息爆炸已经成为当今社会一个很严峻的问题。当潮水般的信息涌向人们时,传统人工处理信息的手段己经远远不能满足人们的需要。而自动文本摘要技术就是解决这一问题的有力工具之一.自动文本摘要是指利用计算机自动对文本编制摘要,是自然语言处理的重要应用领域之一。文摘是准确全面地反映某一文章中心内容的简洁连贯的短文,与索引相比更能满足信息获取的要求。自动文本摘要也是一项极具难度和挑战性的工作,人类已经对此进行了五十余年的探索。我国对自动文摘技术的研究目前还在初级阶段,但此技术所具有的重要作用是不可低估的,必将在未来的信息
2、处理领域得到广泛的应用。针对目前自动文本摘要的研究现状,本文首先使用基于统计的方法对文本进行特征统计,计算词和句子的权重,摘取出权值较高的句子。然后对这些句子应用了一种基于向量相似度计算的算法进行指代消解,同时也提出了一种新的句子向量相似度的计算方法去除冗余,最后利用启发式规则进行加工,从而得到文本摘要。本文在上述研究的基础上,设计了基于句子重述技术的自动文本摘要系统,实现了机器自动生成文摘的各个模块的功能。实验结果显示经过句子重述后的文摘具有较好的连贯性和流畅性,与修改之前的文摘相比较,文摘质量有明显提高。关键词:文本摘要;权重:相似度;重述;指代消解ABSTRACTAl
3、ongwimtheadvancementofsocietyandthedevelopmentoftheIlltcmcttcclmology,theinformationavailableontheWorldWideWebisgrowingexponentially,andtheinformationexplosionhasbeC.,omeaveryseriousproblemnowadays.Wheninformationemergepeopleliketidewater,thetraditionalmanualmeansofinformationprocessinghas
4、beenfarfrommeetingpeople'sneeds.Moreover,anautomatictextsummarizationsystemisoneofthepowerfultoolstosolvethisproblem.Ingeneral,automatictextsummarizationisdefinedastheprocessofabstractingadocumentautomaticallybyutilizingcomputer,anditisalsoregardedasoneofNLP(NaturalLanguageProcessing)’Simp
5、ortantapplications.Summarization伽lexpressthemainideaofanarticleaccuratdyandcomprehensively,itiscomposedofsomesuccinctandcoherentsentences.ComparedwiⅡlindex,summarizationcanmoresatisfytherequestofinformationaccess.Automaticabstractisofgreatdifficultiesandchallenges,andhasbeenexploredforabou
6、tfiftyyears.Researchofautomaticsummarizationofourcountryisinitsprimarystage,butthesignificantroleofthistechnologycannotbeunderestimated,anditmustbeextensivelyusedinthefutureofinformationprocessingarea.Aimingatthepresentresearchsituationofautomatictextsummarization,thispaperfirstanalyzesthe
7、documentusingthestatistic-basedmethod,gatherstheinformationoftextfeaturestatistics,calculatestheweightsofthewordsandsentences,andextractsthesentenceswithhigherweight.Followedbytheapplicationofanaphoraresolutionusinganalgorithmbasedonvectorresemblance,weremover
此文档下载收益归作者所有