面向问答社区意见选择类问题的答案融合技术的研究

面向问答社区意见选择类问题的答案融合技术的研究

ID:32229236

大小:1.52 MB

页数:63页

时间:2019-02-01

面向问答社区意见选择类问题的答案融合技术的研究_第1页
面向问答社区意见选择类问题的答案融合技术的研究_第2页
面向问答社区意见选择类问题的答案融合技术的研究_第3页
面向问答社区意见选择类问题的答案融合技术的研究_第4页
面向问答社区意见选择类问题的答案融合技术的研究_第5页
资源描述:

《面向问答社区意见选择类问题的答案融合技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391.3学校代码:10213国际图书分类号:681.37密级:公开工学硕士学位论文面向问答社区意见选择类问题的答案融合技术研究硕士研究生:孙振鹏导师:刘秉权副教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONTHEOPINIONQUESTIONORIENTEDANSWERSUMMARIZA

2、TIONTECHNIQUESINCQASERVICESCandidate:SunZhenpengSupervisor:AssociateProf.LiuBingquanAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstitut

3、eofTechnology哈尔滨工业大学工学硕士学位论文摘要随着问答社区(community-basedQuestionAnswering)的兴起,大量的问答资源在用户的交互中产生,为具有相似问题的用户解决问题提供了参照。问答资源中有一类问题称为意见选择类问题,即提问者询问某种观点是否正确或者某种行为是否可行。用户浏览这类问题可能出现的一个麻烦是答案繁多,不便于用户快速掌握所有回答者对于问题的意见的全貌。针对这一情况,本文做了以下几个方面的研究:第一,本文将意见选择类问题的答案看做有情感倾向性的文本,使用无监督学习和有监督学习两类方法对答案进行情感极性的判断

4、。无监督方法学习通过使用基于WordNet的方法来计算词的情感极性,进而计算答案的情感极性。有监督方法通过朴素贝叶斯模型、SVM模型和最大熵模型对答案的极性进行分类,并使用集成分类方法进一步提升分类的准确率。最后实验验证了几种方法在判断答案极性方面的有效性。第二,本文使用了基于MMR模型的文摘方法对答案文本以句子为文本单位进行了摘要研究,使用WordNet对答案进行词集的扩充以解决短文本所造成的稀疏性问题。之后本文提出了融合情感极性信息和MMR模型的答案摘要方法,结合答案文本的情感倾向信息对MMR模型做出了三种不同的改进。最后使用ROUGE评价标准对模型的有

5、效性进行评价。实验证明融合情感信息可以提升MMR模型进行答案摘要的效果,其中利用情感信息来更准确的刻画句子相似性对于改进摘要效果最为显著。第三,实现了一个基于CQA答案融合资源的意见查询系统。系统利用Yahoo!Answer问答社区信息,对与查询相关的问答资源进行了答案融合并以良好的方式进行了呈现。关键词:问答社区;情感极性判别;答案摘要;MMR;ROUGE;WordNet-I-哈尔滨工业大学工学硕士学位论文AbstractWiththedevelopmentofCQA,thescaleofquestion-answeringresourceprovided

6、byusersgrowsrapidly,whichdoesmuchfavortopeoplewhohavesimilarquestionsasthoseinCQA.AnumberofquestionsintheCQAcorpuscanbecategorizedastheopinionchoosingquestions,theaskersofwhichaimtogettheopinionsabouttheirownactionsorideasfromtheothers.Theproblemforuserstoreadanswersofthequestionsi

7、sthattherearetoomanyanswersprovidedbyuserstohaveanoverviewofthoseefficiently.Tosolvethisproblem,wehaveresearchonthefollowingaspects:First,wetreattheanswersoftheopinionchoosingquestionasthetextswhichcontainsentimentpolarity,andusebothsupervisedandunsupervisedmethodstodecidethepolari

8、tyofanswers.Bycomputingthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。