欢迎来到天天文库
浏览记录
ID:35065043
大小:2.44 MB
页数:68页
时间:2019-03-17
《基于情绪认知常识库的文本情绪原因发现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于情绪认知常识库的文本情绪原因发现TEXTEMOTIONCAUSEDETECTIONBASEDONEMOTIONALCOMMONSENSEKNOWLEDGE-BASE王赵煜哈尔滨工业大学2015年12月国内图书分类号:TP391.4学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文基于情绪认知常识库的文本情绪原因发现硕士研究生:王赵煜导师:徐睿峰副教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2015年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:T
2、P391.4U.D.C:621.3DissertationfortheMasterDegreeinEngineeringTEXTEMOTIONCAUSEDETECTIONBASEDONEMOTIONALCOMMONSENSEKNOWLEDGE-BASECandidate:ZhaoyuWangSupervisor:AssociateProf.RuifengXuAcademicDegreeAppliedfor:MasterinEngineeringSpeciality:ComputerScienceandTechnologyAffilia
3、tion:ShenzhenGraduateSchoolDateofDefence:December,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要随着互联网的飞速发展以及社会化媒体的兴起,社会化媒体文本特别是包含情感信息的文本出现了爆炸式的增长。针对此类文本的舆情监控和群体性事件预测等问题的研究意义逐渐凸显。在目前已经逐渐成熟的文本情感分析的基础上,对社会化媒体文本中较深层次信息的挖掘越显重要。作为其中的一个重要研究方向,文本
4、情绪原因发现具有很大的研究价值和实际意义。本文主要研究利用大规模文本数据构建情绪认知常识库的方法,在此基础上研究结合认知常识库的文本情绪原因发现方法。主要工作包括:第一、设计并构建面向于新闻文本的情绪原因标注语料库。为此,设计了完整的标注体系和标注质量监控机制。目前已构建完成包含2105条情绪文本的原因标注。在该语料库上对情绪原因进行了结构分布与规则分布上的详细统计,以及不同类型文本的差异性分析,为后续情绪原因发现的研究提供了数据基础和理论依据。第二、研究认知常识库的自动构建方法和扩建方法。首先利用新浪社会新闻的读者情绪投票数据为线索
5、,实现了对较大规模社会新闻语料的自动化情绪标注。利用这些大规模有标签文本挖掘与情绪类别相关的常识知识,自动构建带有情绪激发类别强度的认知常识库。考虑到此类常识库存在覆盖率不足的问题,本文设计实现了一种基于HowNet和同义词词林的常识库扩展方法,实现了认知常识库的有效扩展,使其在原有规模基础之上扩充了三倍以上。第三、研究基于认知常识库的文本情绪原因发现算法,使原因识别的F值相对基线系统提高了12.37%。在此基础之上进一步研究了结合常识库与规则方法以及结合常识库与机器学习方法的文本情绪原因发现算法,使原因识别的F值分别提高了1.27%
6、和15.01%。本文研究显示认知常识库可以作为有效的知识来源和新的特征,进一步提高现有文本情绪原因发现方法的性能。关键字:文本情绪归因;认知常识库;语料库构建-I-哈尔滨工业大学工学硕士学位论文AbstractWiththerapiddevelopmentofInternetandtheriseofsocialmedia,thesocialmediatexts,especiallytheoneswithemotioninformation,growexplosively.Thus,thepublicopinionmonitoringa
7、ndgroupeventpredictiononthesetextsbecamemoreimportant.Uptonow,thetextemotionanalysisbecomespractical.Baseonthis,asanimportantresearchdirect,thestudyontextemotioncausedetectionattractsmuchresearchinterestbecauseithasshowngreatresearchvalueandpracticalsignificance.Thisstu
8、dyinvestigatestheapproachforconstructingemotionalcommonsenseknowledge-basebasedonlargescaletext,andmethodforde
此文档下载收益归作者所有