欢迎来到天天文库
浏览记录
ID:23519964
大小:2.90 MB
页数:58页
时间:2018-11-08
《基于多特征融合的中文自动问答系统研究与设计.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、合肥工业大学硕士学位论文基于多特征融合的中文自动问答系统研究与设计姓名:祖永亮申请学位级别:硕士专业:计算机系统结构指导教师:田卫东20100401知识问答网http://www.tenideas.com.cn/基于多特征融合的中文自动问答系统研究与设计摘要随着以计算机与互联网为代表的信息采集、存储和处理技术的飞速发展和广泛应用,现代社会的信息急剧膨胀,如何更准确、快捷地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统由于具有能理解用自然语言表达的问题、可精确定位和抽取问题的正确答案的特点,成为解决此问题的
2、有效手段,是该领域研究的热点之一。本文从设计实用中文自动问答系统的角度出发,在分析现有问答系统不足的基础上,针对中文语言和中文问题的特点,围绕问答系统的问题理解、信息检索和答案抽取等部分的关键技术问题展开研究,以期提高问答系统的性能。本文的主要工作如下:(1)针对问题理解中的问题分类技术,在分析中文问题中的疑问词、中心词与问题类型之间关系的基础上,结合中文语言和中文问题的特点,提出了基于疑问词.中心词启发式规则的问题分类方法,并通过实验验证了这种分类方法的有效性。(2)对于信息检索部分的设计问题,在分析现有信息检索技术的基础上
3、,建议在开源全文检索框架Lucene的基础上,通过改进其中的文档评分方法,来构造适合于中文问答系统的文档检索器。(3)为提高答案抽取部分的准确性,在参考句子全信息特征的基础上,提出了一种基于多特征融合的答案抽取方法。该方法充分利用问题与答案之间存在的相似信息,在词形、句法、语义三个层次上同时考察问题句与候选答案句的相似度,把问题与答案在语义上的意相似性和句法上的形相关性统一起来,以更精确的完成答案检索以及答案抽取工作。实验证明,这种方法能够提高答案抽取的精度。(4)在以上研究基础上,本文开发了一个中文问答原型系统。关键词:中文
4、自动问答系统,问题分类,信息检索,答案抽取,语义相似度知识问答网http://www.tenideas.com.cn/ResearchandDesignofChineseQuestionAnsweringSystemBasedonMulti——FeaturesCombinationAbstractTherapiddevelopmentandapplicationofinformationtechnologycharacterizedbycomputerandInternet,suchasinformationacquisiti
5、ontechnology,storagetechnology,andprocessingtechnologyetc.,hasbroughtanexplosivegrowthofinformation.Howtoextractinformationthatusersreallyneedfromlargevolumeofinformationaccuratelyandrapidlyhasbecomeamoreandmoreimportantissues.Characterizedbytheablityofunderstaningq
6、uestionsexpressedbyChineselanguageandtheablityoflocationandextractionrightanswer,QuestionAnsweringSystem,abreviatedbyQAS,isoneoftheeffectivemethodstotheaboveissuesandhasbeenoneofthehottopicsinthatfield.AimingatdesigninganappliedChineseQAS,onthebasisoftheanalysisofth
7、edeficiencyofthedevelopedQAS,keytechniquesinquestionunderstandingcomponent,informationretrievalcomponent,andanswerextractioncomponentetc.,werestudiedinthisdissertationinordertoimprovetheQASperformance.Themaincontributionsofthisdissertationareasfollows:(1)Forthequest
8、ionclassificationprobleminquestionundestanding,basedontheanalysisoftherelationbetweeninterrogativesandanswertypesandtherelationbetweenhead
此文档下载收益归作者所有