机器学习算法融合实现微博细粒度情感分类

机器学习算法融合实现微博细粒度情感分类

ID:20216883

大小:51.00 KB

页数:3页

时间:2018-10-11

机器学习算法融合实现微博细粒度情感分类_第1页
机器学习算法融合实现微博细粒度情感分类_第2页
机器学习算法融合实现微博细粒度情感分类_第3页
资源描述:

《机器学习算法融合实现微博细粒度情感分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、机器学习算法融合实现微博细粒度情感分类摘要:目前主观信息情感分类常用的方法主要有基于情感知识和基于规则两类,其中机器学习方法在效果上优于基于情感知识的方法。但机器学习算法要求数据分布均匀,单一的算法有各自的优点和缺点,因此,本文综合多种机器学习算法突出他们的优点避免其缺点,提出了一种多算法集成的微博细粒度情绪分类方法。我们首先采用朴素贝叶斯(NB)分类器对微博进行主客观的粗粒度分类,然后基于情感本体库对有情绪微博建立空间向量模型,最后采用支持向量机(SVM)算法对微博进行细粒度情感判别。实验结果表明,机器学习算法融合的分类方法结果要好于单一分类算法和基于情感词典的方法。关键词:微博细粒

2、度情绪;多策略集成方法;机器学习算法;朴素贝叶斯;支持向量机Fusedmachinelearningalgorithmtoachievemicro-blogfine-grainedemotionclassificationAbstract:Atpresent,thedictionarybasedandtherulesbasedmethodareusuallyusedintextsentimentclassificationtask.Themachinelearningalgorithmineffectisbetterthanthemethodbasedondictionary.Hoac

3、hinelearningalgorithmsrequiredatadistributionandasinglealgorithmhasitsoulti-strategyintegratedalgorithmaboutfine-grainedemotionrecognitionisproposedbyus.Firstly,applyNaiveBayes(NB)classifiertoidentifysentimentornon-sentimentaboutamicro-blog.Thenrepresentmicro-blogthathasemotiontospacevectorbased

4、onemotionalontology.Finally,supportvectormachine(SVM)algorithmtodeterminemicro-blog’sfine-grainedemotion.Andtheexperimentresultsprovedthatintegrationofmachinelearningalgorithmsclassificationisbetterthansingleclassificationalgorithmandemotionaldictionary-basedapproach..KeyotionofChinesemicro-blog

5、;multi-strategyintegratedalgorithm;machinelearningalgorithm;naivebayes;supportvectormachine引言  随着互联网的高速发展,“以用户为中心,用户参与”的开放式构架理念已深入人心,互联网用户逐渐由被动地接收网络信息向主动创造互联网信息迈进[1]。门户网站、论坛、微博等网络媒介已经成为人们发布、传播和获取评论信息的重要平台,其中微博情感分析是研究的热点之一,国内外学者围绕着微博展开了一系列研究。需要注意的是微博文本具有不同于新闻、产品评论的几个特点:微博属于短文本,长度有最大字数限定,结构差异性大;微博

6、文本交互性强、用语不规范偏口语化;微博文本特征关键词少、存在大量变形词和网络新词。国外一些学者采用基于语义的关联分析,基于情感词典和基于K最邻近、SVM等机器学习算法对t表示维度标识,取值为1到21之间的整数,维情感类的总词数,intension表示情感强度,polarity表示情感极性,,是取值在0到1之间的可调参数,设定为=0.85,=0.15。整体表示第m维的权重等于微博中属于这一维的所有情感词的强度和极性加权求和,对各维计算得到所有微博的21维向量矩阵。SVM对7类细粒度情感进行分类  本文使用SVM的训练分类程序来自台湾大学林智仁教授等开发的Libsvm[16]。本文将在7个

7、细粒度情感标签上对微博进行分类,因此这是SVM多标签分类问题。在处理SVM多标签分类问题时,往往将其分解成一系列的二分类问题加以解决,常见的处理方法包括1-a-r、1-a-1以及DAGSVM。本文采用1-a-1方法构建多类分类器,使用此方法在计算效率和分类效果上具有更好的性能。此方法分别选取2个不同类别构成一个SVM子分类器,共构建了k(k-1)/2个子分类器。本文采用径向基函数高斯核作为SVM的核函数,将训练集按照libsvm规定的文本格式输

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。