欢迎来到天天文库
浏览记录
ID:34043230
大小:2.15 MB
页数:52页
时间:2019-03-03
《中文问答系统中的问题分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、合肥工业大学硕士学位论文中文问答系统中的问题分类研究姓名:高艳影申请学位级别:硕士专业:计算机应用技术指导教师:田卫东2011-04中文问答系统中的问题分类研究摘要问答系统是一种能理解使用自然语言描述的问题,并在海量信息中进行问题答案的准确定位查找和答案合成的智能信息处理系统,是数据挖掘领域的研究热点之一。问题分类则是问答系统处理问题过程中,用于对使用自然语言描述的问题进行分类,尽量搜集充分的与问题相关的信息,以提高问答系统后续环节处理的准确性和处理效率。本文主要针对中文问答系统中的问题分类进行研究,利用中文语言和中文问题的特点以进一步提高中文问题的分类
2、精度,达到改善中文问答系统性能的目的。本文的主要研究工作如下:(1)在观察和分析中文问题中的疑问词和中心词与问题分类之间关系的基础上,对基于词性和启发式规则来抽取疑问词和中心词方法,给出两种词性修正方法以提高抽取的准确率,并根据自学习方法进行规则训练;设计了一种采用自学习规则和贝叶斯模型相结合的问题分类方法,该方法克服了规则方法覆盖率不高的缺点。实验表明了该方法的有效性。(2)为进一步提高中心词抽取方法的准确性,本文就句法结构信息在中文问题分类中的应用进行了探讨,设计了一种利用句法结构信息抽取中心词的方法,并建立了相关抽取规则。实验验证了该方法的有效性。
3、关键词:中文问答系统;问题分类;自学习规则;层次分类;句法结构ResearchontheQuestionsClassificationintheChineseQuestionAnsweringSystemAbstractChineseQuestionAnsweringSystem,whichisaresearchfocusingareasindatamining,isanintelligentinformationprocessingsystemwhichcanunderstandtheissuesdescribedinnaturallanguage,l
4、ocatethecorrectpositionoftheanswerandsynthesizeanswerfromthemassinformation.Questionclassification,asakeystepintheprocessofQuestionAnsweringSystem,isusedtoclassifythequestiondescribedinnaturallanguage,andtotrytocollectsufficientinformationrelatedtothequestionforimprovingtheaccura
5、cyandefficiencyofthefollowingprocessstepsinQuestionAnsweringSystem.MainworkofthisdissertationistostudyquestionclassificationintheChineseQuestionAnsweringsystem,andtrytofindanewclassificationmethodmakinguseofthecharactersofChineseandChinesequestionstoimprovetheclassificationaccura
6、cyoftheChinesequestions,andatlasttoimprovetheperformanceoftheChineseQuestionAnsweringSystem.ThisresearchprovidessomenewinsightsintoChinesequestionclassification:(1)Onthebasisoftheinvestigationontherelationbetweenkeywords,suchasquestionwordsandheadwords,andquestion’scategory,forex
7、tractingquestionwordsandheadwordsmoreaccurate,twomethodsbasedonpart-of-speech-fixing,whichareusedtoimprovetheperformanceoftheexistingmethodbasedonpart-of-speechandheuristicrules,aregiven.AndaquestionclassificationmethodcombiningrulesandBayes,whichcanovercomethefaultsthatrule’scov
8、erageisnothigh,isdesignedtoo.Empiricalre
此文档下载收益归作者所有