基于情感分类的微博主题挖掘算法的研究及应用

基于情感分类的微博主题挖掘算法的研究及应用

ID:35182504

大小:2.80 MB

页数:55页

时间:2019-03-21

基于情感分类的微博主题挖掘算法的研究及应用_第1页
基于情感分类的微博主题挖掘算法的研究及应用_第2页
基于情感分类的微博主题挖掘算法的研究及应用_第3页
基于情感分类的微博主题挖掘算法的研究及应用_第4页
基于情感分类的微博主题挖掘算法的研究及应用_第5页
资源描述:

《基于情感分类的微博主题挖掘算法的研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、;.,:'郑..f是‘r一.一i\_‘K.V1-.f記.-、.巧N巧.-這.秦.安’:苗巧蜂vy'’喪..^f、-^》又落lwt看、\c£,0位巧丰'm::讀減;夸;i'V.、v.、六A^推5|邱'■?:.:筑V;唉运:...為和穀1.i择;-、秦'辨袁星、V/x.片嚇.v答诉苗咬x-.讀譚产為■養;;.-\,,,兴‘■^..杂1i^■^雪fW';苗^'始化爲繁蘇,户聲;汽^yf卷运1^藻;¥..扣禱爲r驚—,黨:’;襄蔓??师占品斬.卢■巧‘..4塞.K;%?巧S满.象i:葱;患>苦/0巧則省暮》s驚满.人--;斟‘

2、i:nt"f;l、:、:美>-J{霍、.若,載.:論巧-v‘^n’詞;唯谓.苗n讀、u批^g^餐皆‘、f接u巧;L,^,.权皆;^V今一^.t:獸,>->1:蒙薦舊^^r,Jr尤齊佑^造独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研巧工作及取得的研究成果。除了文中特别加标注和致谢的地方外,论文中不包含他人己经发表或撰写过的研究成果,也不包含为获得重庆师范大学或其他教育机构的学位或证书而使用过的材料一。与我工同作的同志对本研所做均论文明。究的任何贡献己在中作了确的说明学位论文作者签名;签字曰期;>y

3、俾月曰(,^/^1^^1论文版权使用授权学位书本学位论文作者完全了解重庆师范大学有关保留、学使用,的向国口或机的位论文规定有权保留并家有关部构送交论文复印件和盘,论查心和。本人授权重庆师范大学可允许文被阀借阅义權将,学位论文的全部或部分内容编入有关数据库进行检索可W采用影。印、缩印或扫描等复制手段保存、汇编学位论文学位论文作者签名;签字曰期;o月曰T年成^[.%重庆师范大学硕士学位论文基于情感分类的微博主题挖掘算法的研究及应用硕士研究生:陈国良指导教师:唐万梅教授学科专业:软件工程所在学院:计算机与信息科学学院重庆师范大学二〇一六年四月AThesis

4、SubmittedtoChongqingNormalUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterResearchandApplicationofMicroblogTopicMiningAlgorithmBasedonSentimentClassificationCandidate:ChenGuoliangSupervisor:TangWanmeiProfessorMajor:SoftwareEngineeringCollege:Collegeofcomputerandinformationscien

5、ceChongqingNormalUniversityApril,2016基于情感分类的微博主题挖掘算法的研究及应用摘要当今,微博在创新科技影响下得到迅猛发展,使得越来越多的人们在其平台上发表对自己关注的各种信息的评论,该平台已经成为人们日常生活的一部分。在微博平台上时时刻刻都会产生大量由用户发表的言论信息,包括新闻人物、突发事件、购物体验等等。这些信息中不仅带有用户的情感倾向,而且所含有的主题信息包含着重要的社会价值和商业价值。因此,分析微博上的评论信息的情感倾向,挖掘出主题信息,找出人们所关心和需要的信息就显得尤为重要,也成为了当前许多学者的研究热点。本论文的研究重点是如何从微博评论

6、信息中挖掘出潜在的、具有价值的、蕴含情感的主题信息。论文的主要工作和创新点如下:(1)考虑到评论信息中正向情感的表达和负向情感的表达对主题结果的意义完全不同,本文提出了一种将文本分类和主题挖掘相结合的微博主题挖掘算法SC-LDA(SentimentClassification-LatentDirichletAllocation,SC-LDA)。SC-LDA算法的基本思想是:对微博上的评论信息进行分词处理后的数据首先利用支持向量机(SupportVectorMachine,SVM)进行情感分类,得到正向情感和负向情感两类数据,然后再利用LDA(LatentDirichletAllocati

7、on,LDA)模型对已分类的评论信息进行相关主题挖掘。(2)对本文提出的主题挖掘算法(SC-LDA)进行了仿真实验,仿真结果表明SC-LDA对测试数据集的大小不敏感,对数据源的来源不敏感。同时对获取的未经过分类处理的微博数据也进行了主题挖掘的实验,实验结果表明挖掘得到的主题信息不能够有效的表明用户的情感倾向,可能会影响第三方的推断。从而从相反方向验证了本文所提出算法的有效性。(3)同时为了能够获得更好的用户体验,针对SC-LDA算法

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。