欢迎来到天天文库
浏览记录
ID:37402311
大小:10.09 MB
页数:64页
时间:2019-05-23
《面向领域的网络文本数据情感分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、论文题目:面向领域的网络文本数据情感分析作者姓名:逊达查入学时间:2Q曼至生2旦领域名称:盐篡扭堇丕研究方向:厶王蟹篮区基廑旦指导教师:萱迭旦职称:熬拯副指导教师:遄宣逝职称:副婴塞旦论文提交El期:论文答辩El期:授予学位El期:2Q曼圣生§旦2Q呈圣生鱼旦墨旦SENTIMENTANALYSISOFTHEDOMAIN..ORIENTEDNETWORKTEXTD峨KIUlllllIlllllllLIIIllIllIIIY2434190ADissertationsubmittedinfulfillmentofthereq
2、uirementsofthedegreeofMASTEROFENGINEERINGfromShandongUniversityofScienceandTechnologybySunBingjieSupervisor:ProfessorZengQingtianCollegeofInformationScienceandEngineeringMay2013明本人呈交给山东科技大学的这篇工程硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的研究成果。该论文资料尚没有呈交于其它任何学术机关作鉴定。AFF
3、IRMATION日期:ⅥD.f.2Ideclarethatthisdissertation,submittedinfulfillmentoftherequirementsfortheawardofMasterofEngineeringAdministrationinShandongUniversityofScienceandTechnology,iswhollymyownworkunlessreferencedofacknowledge.Thedocumenthasnotbeensubmittedforqualific
4、ationatanyotheracademicinstitute.SignatuDate:士尸山东科技火学工程硕:J:学位论文摘要文本情感分析是网络舆情分析的重要组成部分,特别是在贴吧、微博等新型媒体出现之后,大量的网络口语化文本以极快的速度更新,传递着网民对于网络热点事件的看法,如何快速有效的挖掘网络用户对于特定事件的情感倾向性,挖掘在网络大环境下的公众态度,对于辅助政府决策和网络舆情的预警有着重要的意义。目前对于文本情感分析的方法存在着以下问题:基于情感词典的方法情感倾向性权重量化不够细致、未登录情感关键词难于识别
5、、有监督的机器学习方法太过于依赖语料且测试训练较为繁琐、无监督的机器学习方法太过于依赖初始的基础情感关键词以及准确率低等问题。特别是对于网络口语化和领域倾向性比较严重的领域网络文本缺乏较好的情感分析方法,本文针对特定领域网络文本的情感分析做了以下几点工作:(1)提出了用于领域网络文本情感分析的词典构造方法。针对各领域的贴吧数据利用网络爬虫获取一定数量级的语料,对语料进行预处理、分词和数据清洗等工作,得到各领域的结构化语料。对这些结构化的语料进行统计分析得到领域网络常用词表,领域网络常用词表经过情感标注之后得到领域网络情
6、感词表,各领域网络情感词表最终经统计得到通用网络情感词表。(2)基于所构造的词典,设计并对比了网络文本情感分析的两种方法。利用统计得到的通用网络情感词表和各领域的网络情感词表补充HowNet情感词典。对于网络文本分两种处理方法进行讨论:一是先分词再匹配情感关键词:二是预先不进行分词处理而利用情感关键词命中的方法识别网络文本中的情感词。本文将就两种网络文本的处理方法进行对比分析。(3)设计对比实验,对比在利用相同情感关键词权重计算方法的前提下,两种网络文本处理方法在情感计算效果上的差异以及对比加入网络情感关键词前后的情感
7、分析准确率、召回率的差异;选择两者中表现效果较好的方法,对比基于HowNet的无监督的机器学习方法和改进的基于统计的情感关键词权重计算方法在表现效果上的差别,以此来说明本文采用的基于统计的情感关键词权重计算方法的有效性和在处理网络文本情感倾向性方面的优点。通过实验验证本文所构建的网络情感词词典可以有效提高领域网络文本情感倾向性山东科技人学工程硕二l:学位论文摘要分析的效果,本文所采用的情感倾向性计算方法也是可行和有效的。最后,简单设计了网络文本情感倾向性分析的可视化界面,支持单段网络文本的情感分析和批量网络文本情感分析
8、。对于某一突发热点事件的批量文本进行情感分析后可以直接生成对应的情感倾向性分布图。关键词:领域网络文本,贴吧,词典,HowNet,情感分析AbstractTextsentimentanalysisisoneofthemostimportantcomponentsofnetworkpublicopinionanalysis.Espe
此文档下载收益归作者所有