受限域问答系统问句分类方法的研究

受限域问答系统问句分类方法的研究

ID:34187376

大小:860.34 KB

页数:61页

时间:2019-03-04

受限域问答系统问句分类方法的研究_第1页
受限域问答系统问句分类方法的研究_第2页
受限域问答系统问句分类方法的研究_第3页
受限域问答系统问句分类方法的研究_第4页
受限域问答系统问句分类方法的研究_第5页
资源描述:

《受限域问答系统问句分类方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、杭州电子科技大学硕士学位论文受限域问答系统问句分类方法研究研究生:嵇宇指导教师:王荣波副教授2012年12月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterResearchonQuestionClassificationMethodinRestricted-DomainQuestion-AnswerSystemCandidate:JiYuSupervisor:ViceProf.WangRongboDecember,2012杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑

2、重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借

3、阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日杭州电子科技大学硕士学位论文摘要受限域问答系统是自动问答系统的一种,相对于开放域问答系统更具实用性和可行性而成为自然语言处理领域的研究热点。受限域问答系统通常包含三个部分:问句分析、信息检索和答案抽取。问句分类是问句分析中的一个重要模块,对问句进行分类,可以减少检索范围而提高其效率,且类别信息可以指导答案抽取策略,因此问句分类的性能直接影响问答系统的性能和质量。问句分类包括问句预处理、问句表示、特征选取

4、、特征权重计算、分类算法设计等处理流程,其中特征选取、特征权重计算和分类算法的设计是问句分类模块中的核心部分,本文主要做了以下研究工作。首先,本文提出了一种基于词关联网络的领域问句特征权重计算方法。该方法针对目前特征权重计算方法都是基于统计信息而不考虑语义信息的缺点,结合受限域的特点,利用《同义词词林(扩展版)》计算同类问句集合中词语间语义相似度,将语义相似度作为路径构建词关联网络,并根据网络系统中节点重要性理论与TF-IDF思想相结合计算领域问句特征的权重。其次,本文提出了一种基于改进的二次贝叶斯分类模型的领域问句分类算法。该方法采用句法信息和句法结构分析提取领域问句

5、特征,针对受限域的特殊性对传统的贝叶斯分类器做出改进,结合基于词关联网络的领域问句权重计算方法对领域问句进行分类。最后,本文利用昆明理工大学智能信息处理实验室提供的旅游领域语料设计并实现多次对比实验,对提出的特征权重计算方法和分类算法进行了验证,并给出实验数据和评价结果。实验结果证明了本文方法的可行性。关键词:问答系统,问句分类,特征权重,词关联网络,二次贝叶斯模型,中文信息处理I杭州电子科技大学硕士学位论文ABSTRACTTheQuestionansweringsystem(QA)inrestricteddomainisahotresearchtopicinnatur

6、allanguageprocessingbecauseofitspracticalitycomparedtoageneralQAinopendomain.AQAinrestricteddomaintypicallyconsistsofthreeparts:questionanalysis,informationretrievalandanswerextraction.Questionclassificationplaysanimportantroleinquestionanalysismodulewhichcaneffectivelyreducetherangeofin

7、formationretrievalprocessinganddeterminethetypeofanswerextractionstrategy.SotheperformanceofquestionclassificationdirectlyaffectstheperformanceawholeQA.Questionclassificationprocedureincludesquestionpre-processing,questionexpression,featureselection,featureweightmeasurean

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。