基于多特征融合的中文自动问答系统研究与设计.pdf

基于多特征融合的中文自动问答系统研究与设计.pdf

ID:23519964

大小:2.90 MB

页数:58页

时间:2018-11-08

基于多特征融合的中文自动问答系统研究与设计.pdf_第1页
基于多特征融合的中文自动问答系统研究与设计.pdf_第2页
基于多特征融合的中文自动问答系统研究与设计.pdf_第3页
基于多特征融合的中文自动问答系统研究与设计.pdf_第4页
基于多特征融合的中文自动问答系统研究与设计.pdf_第5页
资源描述:

《基于多特征融合的中文自动问答系统研究与设计.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、合肥工业大学硕士学位论文基于多特征融合的中文自动问答系统研究与设计姓名:祖永亮申请学位级别:硕士专业:计算机系统结构指导教师:田卫东20100401知识问答网http://www.tenideas.com.cn/基于多特征融合的中文自动问答系统研究与设计摘要随着以计算机与互联网为代表的信息采集、存储和处理技术的飞速发展和广泛应用,现代社会的信息急剧膨胀,如何更准确、快捷地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统由于具有能理解用自然语言表达的问题、可精确定位和抽取问题的正确答案的特点,成为解决此问题的

2、有效手段,是该领域研究的热点之一。本文从设计实用中文自动问答系统的角度出发,在分析现有问答系统不足的基础上,针对中文语言和中文问题的特点,围绕问答系统的问题理解、信息检索和答案抽取等部分的关键技术问题展开研究,以期提高问答系统的性能。本文的主要工作如下:(1)针对问题理解中的问题分类技术,在分析中文问题中的疑问词、中心词与问题类型之间关系的基础上,结合中文语言和中文问题的特点,提出了基于疑问词.中心词启发式规则的问题分类方法,并通过实验验证了这种分类方法的有效性。(2)对于信息检索部分的设计问题,在分析现有信息检索技术的基础上

3、,建议在开源全文检索框架Lucene的基础上,通过改进其中的文档评分方法,来构造适合于中文问答系统的文档检索器。(3)为提高答案抽取部分的准确性,在参考句子全信息特征的基础上,提出了一种基于多特征融合的答案抽取方法。该方法充分利用问题与答案之间存在的相似信息,在词形、句法、语义三个层次上同时考察问题句与候选答案句的相似度,把问题与答案在语义上的意相似性和句法上的形相关性统一起来,以更精确的完成答案检索以及答案抽取工作。实验证明,这种方法能够提高答案抽取的精度。(4)在以上研究基础上,本文开发了一个中文问答原型系统。关键词:中文

4、自动问答系统,问题分类,信息检索,答案抽取,语义相似度知识问答网http://www.tenideas.com.cn/ResearchandDesignofChineseQuestionAnsweringSystemBasedonMulti——FeaturesCombinationAbstractTherapiddevelopmentandapplicationofinformationtechnologycharacterizedbycomputerandInternet,suchasinformationacquisiti

5、ontechnology,storagetechnology,andprocessingtechnologyetc.,hasbroughtanexplosivegrowthofinformation.Howtoextractinformationthatusersreallyneedfromlargevolumeofinformationaccuratelyandrapidlyhasbecomeamoreandmoreimportantissues.Characterizedbytheablityofunderstaningq

6、uestionsexpressedbyChineselanguageandtheablityoflocationandextractionrightanswer,QuestionAnsweringSystem,abreviatedbyQAS,isoneoftheeffectivemethodstotheaboveissuesandhasbeenoneofthehottopicsinthatfield.AimingatdesigninganappliedChineseQAS,onthebasisoftheanalysisofth

7、edeficiencyofthedevelopedQAS,keytechniquesinquestionunderstandingcomponent,informationretrievalcomponent,andanswerextractioncomponentetc.,werestudiedinthisdissertationinordertoimprovetheQASperformance.Themaincontributionsofthisdissertationareasfollows:(1)Forthequest

8、ionclassificationprobleminquestionundestanding,basedontheanalysisoftherelationbetweeninterrogativesandanswertypesandtherelationbetweenhead

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。