基于复述技术的汉语情感分析方法研究论文

基于复述技术的汉语情感分析方法研究论文

ID:33441690

大小:3.38 MB

页数:72页

时间:2019-02-26

基于复述技术的汉语情感分析方法研究论文_第1页
基于复述技术的汉语情感分析方法研究论文_第2页
基于复述技术的汉语情感分析方法研究论文_第3页
基于复述技术的汉语情感分析方法研究论文_第4页
基于复述技术的汉语情感分析方法研究论文_第5页
资源描述:

《基于复述技术的汉语情感分析方法研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号⋯⋯⋯⋯⋯⋯~UDC密级⋯公⋯开⋯⋯Z务声夕擎硕士研究生学位论文基于复述技术的汉语情感分析方法研究申请人:学号:培养单位:学科专业:研究方向:指导教师:完成日期:王超越2111338计算机科学技术学院计算机应用技术自然语言处理付国宏教授2014年5月20日⋯f嘲嬲中文摘要随着web2.0的兴起和社会网络的迅速发展,人们以网络为媒介发表自己对某个事件或事物的评论和看法。产品评论作为最重要的情感信息来源,一直被学术界广泛使用。如何挖掘这些产品评论中所蕴含的丰富情感信息,成为当前自然语言处理(NaturalLanguageProcessing,NLP)相关领域的研究热点之一

2、。复述是指使用不同的词汇来表达相同含义的句子或短语。由于复述具有广泛的获取来源,且可以引入丰富的语言特征,所以复述在NLP的很多领域中都有重要的应用。本文在深入分析汉语产品评论的复述特点基础上,从语义角度出发,探索语义和情感极性相融合的意见复述抽取方法。并将获取的复述知识应用于汉语产品意见文本分析,以缓解统计情感分析所面临的数据稀疏问题,从而提高了情感分析性能。具体地,本文从以下三个方面展开研究:(1)基于语素的汉语未登录词词义预测。未登录词的词义预测一直是制约汉语词义消歧性能的一个瓶颈。为了获取情感分类所需的词义信息,本文以语素作为基本标注单位,在最大熵模型的框架下融合未

3、登录词语内部结构特征和外部上下文特征,提出一种基于语素的汉语词义预测方法。实验结果表明,基于语素的方法可以有效融合词语内部特征,从而提高了未登录词词义预测的准确性。(2)融合语义和情感极性的汉语意见复述识别。本文在分析汉语意见复述特点的基础上,以意见要素为基本单位,探索语义和情感极性相融合的意见复述识别方法,并分析和比较了不同的复述识别方法。实验结果证明了融合语义和情感极性的意见复述识别方法的有效性。(3)基于复述生成的汉语情感分类。为了解决统计情感分类面临的数据稀疏问题,本文引入复述生成技术,通过对训练数据和测试数据同时进行复述生成,不仅扩展了训练语料的规模,还通过测试数

4、据复述扩展,弥补了训练语料覆盖度不足而引起的数据稀疏问题。在不同条件下的情感分类实验结果证明引入复述生成可以显著提高情感极性分类的性能。黑龙江大学硕士学位论文关键词:情感分类;未登录词词义预澳4;意见复述识别:意见复述生成AbstractWiththerapiddevelopmentofthesocialnetworks,especiallytheriseofWeb2.0,anexpandingnumberofpeoplebegintoexpresstheircommentsandviewsonthenetworkabouteventsorproducts.Asthemos

5、timportantsourceofemotionalinformation,productreviewshavebeenwidelyusedinacademia.Howtoexploretheabundantinformationontheseemotionshasbecomeahottopicinthefieldofthenaturallanguageprocessing(NaturalLanguageProcessing,NLP).Paraphrasesaresentencesorphrasesthatconveythesamemeaningusingdifferen

6、twords.Asparaphrase’Sresourcescanbeaccessedgenerallyandmorelinguisticfeaturescanbeintroducedatthesametime,paraphrasehasplayedakeyroleinmanyNLPapplications.Thispaperproposesaneffectiveapproachtorecognizeopinionparaphrasebyexploringthecharacteristicofopinionparaphrase,whichcombinedsemantican

7、dsentimentpolarity.Onthisbasis,weextendtheproductreviewsbyparaphrasegeneratingtechnology,SOastOimprovethequalityofsentimentanalysis.Specifically,ourresearchconcernsthefollowingthreeaspects:Thispaperpresentsamorpheme-basedmethodforChineseunknownwordssensepredic

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。