多特征层次化答案质量评价方法研究

多特征层次化答案质量评价方法研究

ID:35072233

大小:3.67 MB

页数:62页

时间:2019-03-17

多特征层次化答案质量评价方法研究_第1页
多特征层次化答案质量评价方法研究_第2页
多特征层次化答案质量评价方法研究_第3页
多特征层次化答案质量评价方法研究_第4页
多特征层次化答案质量评价方法研究_第5页
资源描述:

《多特征层次化答案质量评价方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391密级太原理工大学硕士学位论文题目多特征层次化答案质量评价方法研究英文并列题目ResearchonMulti-featuresHierarchicalAnswerQualityEvaluationMethod研究生姓名:崔敏君学号:2013520236专业:软件工程研究方向:自然语言处理导师姓名:段利国职称:副教授学位授予单位:太原理工大学论文提交日期2016/06地址:山西·太原太原理工大学声明本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含其他个人或集体己经发表或撰写过的科研成果

2、。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:日期:关于学位论文使用权的说明本人完全了解太原理工大学有关保管、使用学位论文的规定,其中包括:○1学校有权保管、并向有关部门送交学位论文的原件与复印件;○2学校可以采用影印、缩印或其它子复制手段复制并保存学位论文;○3学校可允许学位论文被查阅或借阅;○4学校可以学术交流为目的,复制赠送和交换学位论文;○5学校可以公布学位论文的全部或部分内容(保密学位论文在解密后遵守此规定)。签名:日期:导师签名:日期:太原理工大学硕士研究生学位论文多特征层次化答案质量评价方法研究摘要

3、随着web2.0的快速发展,网上问答社区已被广泛的使用,其形式是用户根据自己的需求提出问题,其他用户给出相应的答案,使用户可以更广泛的获取自己所需要的东西。由此产生了一些例如YahooAnswer、Twitter、Facebook、百度知道等社区问答系统。然而,在社区问答中,用户可以随意的发表言论,不可避免的会产生一些低质量信息,这些低质量的答案出现在问答系统中,严重的影响了问答系统的质量,因此,如何对答案质量进行评价变的尤为重要。本文主要针对社区问答系统中答案质量评价方法展开研究。主要分两方面对具体研究内容进行介绍。(1)层次分类模型本文首先分析了社区问答系统的特点以及研

4、究现状,根据前人的研究,现有评价答案质量的方法大多是依据文本或非文本特征,均未注意到对于不同问题类别影响其答案质量评价的特征也有所不同这一现象。例如,对于事实类问题,答案中往往会出现一些名词,对于是非类问题,答案中大多会出现“是”或者“否”,对于建议类问题,答案中一般会出现“我认为”、“我觉得”等一系列词。所以,在对答案质量进行分析时可以充分的利用问题类别这一特征。在此基础上,本文提出一个层次分类模型,首先分析问题类型,针对本文数据利用句法结构提取问题分类的特征对问题进行分类。实验结果表明,提取特定类别的焦点特征可以很好的去除问句分类的噪音,提高问I太原理工大学硕士研究生学

5、位论文题分类的精确度。然后,依据特征影响力随问题类型不同而不同这一客观现象,并提取问答对的文本特征、非文本特征、语言翻译性特征、答案中的链接数四类特征,使用逻辑回归算法评价各问题类型的答案质量,实现基于特征集的答案质量分类器,取得较好的效果。最后分析了影响各问题类型评价答案质量的主要特征。(2)结合情感分析答案质量评价方法本文通过对现有研究成果的分析发现,情感分析在社区问答系统中起到了关键作用,但现有研究都不能对问答社区系统中问答对的情感进行有效分析。针对之前答案质量评价方法研究的不足提出了结合情感分析的答案质量评价方法。该方法将基于机器学习和基于情感词典的情感分析方法相结

6、合,通过构建情感词、程度副词、否定词表、标点符号、用户观点等特征,结合情感特征提出了新的情感值计算公式,结合分类器,通过有监督方法对答案质量进行评价。实验结果表明,结合情感分析的答案质量评价方法的性能更好。关键词:问题类别,特征分析,答案质量评价,层次分类模型,情感分析II太原理工大学硕士研究生学位论文ResearchonMulti-featuresHierarchicalAnswerQualityEvaluationMethodAbstractWiththerapiddevelopmentofweb2.0,theonlinecommunity-basedQuestionA

7、nswering(CQA)hasbeenwidelyusedintheformofauseraccordingtotheirneedstoaskquestions,theanswersaregivenbyotherusers,sothatuserscangetawiderrangeofwhattheyneed.ThusthequestionandanswersystemareproducedsuchasAnswerTwitter,Yahoo,Facebook,Baiduknowandothercommunities

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。