欢迎来到天天文库
浏览记录
ID:32022480
大小:1.60 MB
页数:40页
时间:2019-01-30
《【硕士论文】中文问答系统中的信息检索模型的研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、重庆大学硕士学位论文中文摘要摘要问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术。目前,国内外有很多的科研机构参与了英文问答技术的研究,甚至己经有相对成熟的英文问答系统,但是参与中文自动问答技术研究的科研机构并不是很多,而且基本没有成型的中文问答系统。本文正是对中文问答技术研究的一个探索。基于自然语言处理的中文问答系统包括五个主要组成部分:问题理解、信息检索、信息处理、答案抽取、FAQ模块五个子系统。信息检索模块是自动问答系统中最重要的模块之一,检索的结果对后面的处理,以至找到问题的正确答案都有很大的影响,同时
2、它也是智能咨询系统、机器对话等研究的重要方面。本文充分结合了汉语语言的特点以及计算语言学的技术,对问答系统中信息检索模块进行了深入分析,指出了在实际的使用问答系统的时候,用户的回答质量参差不齐。我们不但要尽量检索相似度高的文档,而且还希望检索出来的文档的质量尽可能的好,而传统的信息检索中常用的四种数学模型:布尔模型、模糊逻辑模型、向量模型和概率模型以及基于语言模型的信息检索模型在计算相似度的时候都没有考虑到问题的质量。本文通过最大熵方法用困惑度、序列模型、词的搭配作为特征来评估文档的质量,最后利用翻译模型把问题质量成功的集成到检索模型中。最后,我
3、们从社区问答系统中抽取问答对作为语料进行测试,试验结果表明引入文档质量到检索模型中比传统的检索模型能取得更好的试验结果。关键词:问答系统,信息检索,文档质量,语言模型,最大熵我本沉默http://www.40ok.com重庆大学硕士学位论文英文摘要AbstractQAtechnologyisaveryhotresearchdirectioninthefieldofnaturallanguageprocessing(NLP).ItcombinesalargevarietyofNLPtechnologles.Presently,manyresearc
4、hinstituteshavebeeninvestigatingEnglishQAtechnologies.SomematureEnglishQAsystemshavebeenwidelyrecognized.ButfewinstitutesaredoingresearchonChineseQAsystems.NoChineseQAsystemshavebeenproposeduptonow.Inthispaper,wetrytoinvestigatesometechnologiesforChineseQAsystems.NLP-bascdQAs
5、ystemhasfivemainparts:QuestionAnalysis,InformationRetrieval,InformationProcessing,AnswerExtraction,andFrequentlyAskedQuestionsModule.InformationRetrievalisoneofthemostimportantmodulesoftheNLP-basedQAsystem.TheresultofInformationRetrievalhasagreateffectonfollowingprocessingwor
6、k,evenonfordingthecorrectanswer,ItisalsothemostimportantresearchaspectonIntelligentconsultingSystem,Man-machinedialogue,andsoon.inthispaper,weresearchdeeplyonInformationRetrieval,consideringthecharacterofChineseandtechniqueofcomputationallinguistics.IntheactualuseoftheQAsyste
7、m,thequalityofanswerisuneven.Traditionalinformationretrievalusethefourmathematicalmodels:booleanmodel,fuzzy109icmodel,vector-basedmodel,andprobabilitymodel,butnoneofthemtakeintoaccountthequalityoftheanswer.Sowenseperplexity,sequentialpattern,andlexiealcollocationtopredicttheq
8、ualityofdocumentthroughmaximumentropymethod.Wealsoshowourqualitymeas
此文档下载收益归作者所有