基于条件随机场的中文微博情感分析研究

基于条件随机场的中文微博情感分析研究

ID:35066565

大小:5.81 MB

页数:59页

时间:2019-03-17

基于条件随机场的中文微博情感分析研究_第1页
基于条件随机场的中文微博情感分析研究_第2页
基于条件随机场的中文微博情感分析研究_第3页
基于条件随机场的中文微博情感分析研究_第4页
基于条件随机场的中文微博情感分析研究_第5页
资源描述:

《基于条件随机场的中文微博情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕±学位论文(工学硕±)基于条件随机场的中文微博情感分析研究梁礼欣?二〇—六年五月分类号:11845;学校代号UDC:密级:学号;2111305035广东工业大学硕主学位论文(工学硕±)基于条件随机场的中文微博情感分析研究梁礼欣指导教师姓名、职称;郝志峰教授专业或领域名称;软件工程学生所属学院:计覚机学院论文答辩日期:2016年5月25日ADissertationSubmitedtoGuando

2、nUniversitofggyTechnolofor化eDereeofMast;ergygResearchofSentimentAnalsisforChineseyMicroBlog目asedonConditionalRandomFieldCandidate:LianLngixiSuervisor.p;ProfHaoZhifengMa2016ySchoolofcomputersGuangdongUniversit

3、yofTechnologyGuanzhouGuandonP.R.China510006g,gg,,^摘要近年来,越来越多用户喜欢在微博上发表自己对某个热点事件或商品的态度和观点,对。由于这些观点信息往往带有很强的情感倾向其进行情感信息的挖掘是对商家和政府都具有重大意义的。然而,由于微博句子存在表达不规范性和简短性,而且当前的基础中文文本处理工具并不能很好的适用于微博文本,使得从其中准确地提取情感信息变得十分困难,已。其次有的情感分析方法都忽略了

4、观点句识别和情感倾向分析这两个任务之间的联系,最终导致情感分析的效果普遍不理想,。为此本文主要针对中文微博的特点和影响情感分析效果的关键因素进行深入研究,提出了针对中文微博情感分析的改进算法WDC民巧Word2vecDCRF。具体工作如下:)(1)利用Word2vec扩展微博句子,即利用Word2vec来求句子中每个词的一,,从而得到该句子的词序列前k个相似词。首先对条微博句子进行分词。然后对句子中的每个词利用Word2vec来求它的前k个相似词。最后,将每个词的前

5、k个相似词都加在原句子的词序列后面,从而达到扩展微博的目的。实验证明,扩展后的微博句子会比原微博句子含有更丰富的情感信息,最终使得算法性能提升。(2)建立观点句识别和情感倾向分析这两个任务之间的联系。适过利用Two-Level结构的动态条件随机场(DC民F)模型来建立起观点句识别和情感倾,,向分析这两个任务之间的联系信息使得这两个任务可W同时进行。同时Two-Level结构的动态条件随机场(DC民F)模型还能引入句子间的上下文信息。结合上面两个策略,本文提^WDCRF

6、方法,该方法是将能够融合两个任务间联系信息和句子间上下文联系信息的DCRF模型应用在(1)中利用Word2vec扩展后的微博句子上。最终实验结果证明,本文提出的情感分析方法WDCRF的平均性能高于目前主流的方法,而且能更好地识别中文微博的情感倾向。关键词:情感分析:微博;条件随机场:Word2vecIABSTRACTABSTRACTInrece打tears,morea打dmoreeoleliketoreferthemicrobloexress

7、theirypppgpattitudesa打dopi打io打sforahotcommodityoreve打t.Becausethesemessagesoftenhaveastronemotionaltendenciesitisversinificantforovernmentandg,yggbusiness.However,microblogsen1:enceisofte打shortandexpressionis

8、打otsta打dardized,a打dthecurrentGhinesetextprocessi打gtoolsare打otwellsuitedformicroblog,whichleadsusdifficulttoextractemotionalinformation打omthem.MoreovertheexistinworksinoretheinformationbetweenSubective,ggjcl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。