欢迎来到天天文库
浏览记录
ID:32229236
大小:1.52 MB
页数:63页
时间:2019-02-01
《面向问答社区意见选择类问题的答案融合技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TP391.3学校代码:10213国际图书分类号:681.37密级:公开工学硕士学位论文面向问答社区意见选择类问题的答案融合技术研究硕士研究生:孙振鹏导师:刘秉权副教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONTHEOPINIONQUESTIONORIENTEDANSWERSUMMARIZA
2、TIONTECHNIQUESINCQASERVICESCandidate:SunZhenpengSupervisor:AssociateProf.LiuBingquanAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstitut
3、eofTechnology哈尔滨工业大学工学硕士学位论文摘要随着问答社区(community-basedQuestionAnswering)的兴起,大量的问答资源在用户的交互中产生,为具有相似问题的用户解决问题提供了参照。问答资源中有一类问题称为意见选择类问题,即提问者询问某种观点是否正确或者某种行为是否可行。用户浏览这类问题可能出现的一个麻烦是答案繁多,不便于用户快速掌握所有回答者对于问题的意见的全貌。针对这一情况,本文做了以下几个方面的研究:第一,本文将意见选择类问题的答案看做有情感倾向性的文本,使用无监督学习和有监督学习两类方法对答案进行情感极性的判断
4、。无监督方法学习通过使用基于WordNet的方法来计算词的情感极性,进而计算答案的情感极性。有监督方法通过朴素贝叶斯模型、SVM模型和最大熵模型对答案的极性进行分类,并使用集成分类方法进一步提升分类的准确率。最后实验验证了几种方法在判断答案极性方面的有效性。第二,本文使用了基于MMR模型的文摘方法对答案文本以句子为文本单位进行了摘要研究,使用WordNet对答案进行词集的扩充以解决短文本所造成的稀疏性问题。之后本文提出了融合情感极性信息和MMR模型的答案摘要方法,结合答案文本的情感倾向信息对MMR模型做出了三种不同的改进。最后使用ROUGE评价标准对模型的有
5、效性进行评价。实验证明融合情感信息可以提升MMR模型进行答案摘要的效果,其中利用情感信息来更准确的刻画句子相似性对于改进摘要效果最为显著。第三,实现了一个基于CQA答案融合资源的意见查询系统。系统利用Yahoo!Answer问答社区信息,对与查询相关的问答资源进行了答案融合并以良好的方式进行了呈现。关键词:问答社区;情感极性判别;答案摘要;MMR;ROUGE;WordNet-I-哈尔滨工业大学工学硕士学位论文AbstractWiththedevelopmentofCQA,thescaleofquestion-answeringresourceprovided
6、byusersgrowsrapidly,whichdoesmuchfavortopeoplewhohavesimilarquestionsasthoseinCQA.AnumberofquestionsintheCQAcorpuscanbecategorizedastheopinionchoosingquestions,theaskersofwhichaimtogettheopinionsabouttheirownactionsorideasfromtheothers.Theproblemforuserstoreadanswersofthequestionsi
7、sthattherearetoomanyanswersprovidedbyuserstohaveanoverviewofthoseefficiently.Tosolvethisproblem,wehaveresearchonthefollowingaspects:First,wetreattheanswersoftheopinionchoosingquestionasthetextswhichcontainsentimentpolarity,andusebothsupervisedandunsupervisedmethodstodecidethepolari
8、tyofanswers.Bycomputingthe
此文档下载收益归作者所有