面向评论的跨领域情感分类研究

面向评论的跨领域情感分类研究

ID:34589222

大小:6.31 MB

页数:56页

时间:2019-03-08

面向评论的跨领域情感分类研究_第1页
面向评论的跨领域情感分类研究_第2页
面向评论的跨领域情感分类研究_第3页
面向评论的跨领域情感分类研究_第4页
面向评论的跨领域情感分类研究_第5页
资源描述:

《面向评论的跨领域情感分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文面向评论的跨领域情感分类研究ResearchonCross.domainSentimentClaSSincationofReviews学号:量!!Q壁垒!璺完成日期:2Q!垒二Q垒二星Q大连理工大学DalianUniversit),ofTechnology洲IIIIIIIIUI—Y2590474大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均

2、已在论文中做了明确的说明并表示了谢意。学位论文题目:盔函聋囱叠逢鱼趣:睦丛堡蚴作者签名:建渔占焦鲢日期:挫J年—£与jL日大连理工大学硕士学位论文摘要随着网络社交平台的崛起,海量主观性信息迅速涌现。鉴于这些主观数据往往具有巨大的潜在价值,情感分类、观点挖掘等领域逐渐引起了广泛的关注。然而传统的情感分类具有领域特定性(dormin-specific),即当训练集和测试集数据分布不同时,分类效果往往欠佳。随着信息的迅猛发展,新的领域不断涌现,而人工标注数据既耗时又费力,因此跨领域情感分类具有极其重要的意义。它旨在通过一个领域的数据训练模型,来预测另一个领域文本的情感倾向性。本文旨在解决跨领域

3、文本情感分类问题,主要工作包括以下三个方面:首先,本文提出了一种基于加权SimRank算法的跨领域情感分类模型。该模型先通过ADMI(AbsoluteDifferemeofMutualInformation)算法挑选出频繁出现在两个领域中且带有相同情感倾向性的枢纽特征作为桥梁,然后将枢纽特征与非枢纽特征的关系映射为二部图,在加权SimRank算法的基础下构建潜在特征空问LFS(LatentFeatureSpace)。最后,利用LFS对样本进行重映射,从而减小了不同领域之间的数据分布差异,较好的实现了领域迁移。实验结果表明了该模型在跨领域文本情感分类中的有效性。其次,受评论中旬子主语与领域

4、独立性(dormin-independent)/特定性(donmin-specific)情感词分布关系的启发,本文提出一种主语启发式的跨领域文本情感分类集成模型(Subject-basedModel)。该模型依照评论中旬子的主语,将评论划分为Personal和Object两个视图。其中,Personal视图包括主语或隐含主语是人物(评价者)的句子集;Object视图由主语或隐含主语是评价对象的句子组成。统计发现,Persoml视图往往具有较好的领域独立性,而Object视图则常常具有领域特定性。在此基础上,通过集成学习,有效地融合两个视图,既可以更大的受益于领域独立性部分(Persona

5、l视图),而在一定程度上又可以避免领域特定性部分(Object视图)拉大数据分布差异。最后,实验从监督学习和半监督学习两个方面,验证了Subject-based模型的有效性。最后,鉴于同一条评论中主题(产品属性)的混杂性和情感对主题的依赖性,本文在第2部分工作的基础上,充分考虑样本的质量,提出了一种联合样本过滤和主语启发式的跨领域情感分类集成模型SF.SE(JointSampkFilteringwithSubject.basedEmerrbleModel)。文中首先在句子级上提出了一种同时考虑主题和情感因素的主题模型,称之为SS.LDA。在此基础上,以无监督的方式过滤掉同一条评论中与其情

6、感倾向性不同的句子,从而提高了评论的质量。实验结果表明,该模型能进一步提高分类性能。关键词:情感分类;跨领域;迁移学习;主题模型面向评论的跨领域情感分类研究ResearchonCross.domainSentimentClassificationofReviewsAbstractWiththeriseofsocialnetworkplatforms,massivesubjectiveinformationquicklyemerges.Someresearchfieldssuchasser吐hnentclassificationandopinionmininghaveattractedwi

7、deattentiomowingtoitspotentialapplications.However,sentimentclassificationisdomain-specificduetothedivergentdistributions.Thatistosay,theperformanceUSl.1anyactspoorlywhenthedistribuliorddiffersubstamially.Withtherapidd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。