面向情感倾向性识别的特征分析研究.pdf

面向情感倾向性识别的特征分析研究.pdf

ID:53726845

大小:310.60 KB

页数:4页

时间:2020-04-20

面向情感倾向性识别的特征分析研究.pdf_第1页
面向情感倾向性识别的特征分析研究.pdf_第2页
面向情感倾向性识别的特征分析研究.pdf_第3页
面向情感倾向性识别的特征分析研究.pdf_第4页
资源描述:

《面向情感倾向性识别的特征分析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第9期计算机技术与发展Vo1.24No.92014年9月COMPUTERTECHN0LOGYANDDEVELOPMENTSep.2014面向情感倾向性识别的特征分析研究李妍坊,许歆艺,刘功申(上海交通大学信息安全工程学院,上海200240)摘要:随着互联网和信息技术的迅速发展,网络上用户的评论信息越来越多。利用计算机技术分析网络中大规模文本的情感倾向,在政府的舆情分析和企业的产品评价智能回馈等应用中有着非常巨大的发展前景。文中着重研究了选取不同的文本特征对文本情感倾向性分类精度的影响。实验中所研究的不同文本特征主要包括情感词、形容词、副词、语气词和

2、标点符号等。实验结果表明,选取情感词、形容词、副词作为特征项对情感分类具有较好的效果,在此基础上添加语气词和标点特征可以有效地提高情感分类的精度。该研究成果可用于社会舆情分析、垃圾博客过滤、商晶评论与推荐、影视评价等领域。关键词:情感分析;文本分类;特征选取;支持向量机中图分类号.TP31文献标识码:A文章编号:1673—629X(2014)09-0033—04doi:10.3969/j.issn.1673—629X.2014.09.007ResearchonFeatureAnalysisOrientedTextSentimentIdentificatio

3、nLIYan-fang,XUXin-yi,LIUGong—shen(SchoolofInformationSecurityEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)Abstract:Withtherapiddevelopmentofthelnternetandinformationtechnology,theonlinecommentsofusersfirealsoincreasing.Usingcomputertechnologytoanalyzeemotionalmndenc

4、iesoflarge—scalenetworktextsinthegovernment’spublicopinionanalysisandevalu—ationofthecompany’sproductapplicationssuchasintelligentfeedbackhasenormousdevelopmentprospects.Mainlystudytheinfluenceofselectingdifferenttextfeaturesonthefinalclassificationaccuracyofsentimentclassificatio

5、ninthispaper.Differenttextfeaturesstudiedintheexperimentincludeemotionalwords,adjectives,adverbs,modalandpunctuation.Theexperimentalresultsshowthatselectingemo—tionalwords,adjectives,adverbsasfeatureitemsonsentimentclassificationcanachievegoodclassificationperformance,andaddingmo—

6、dalandpunctuationfeaturescanefectivelyimprovethesentimentclassificationaccuracy.Theresearchfindingscanbeappliedtosocialpublicopinionanalysis,filteringspamblog,commodityreviewsandrecommendations,filmevaluationandsoon.Keywords:sentimentanalysis;textclassification;featureselection;SV

7、MO引言词语、句子、篇章情感倾向性识别。在国外,Kim等当今时代,随着互联网和信息技术的迅速发展,越人将工作重点放在情感词[的倾向性分析上,在基准来越多的人把网络作为社交平台,网络上的评论文章词集的基础上使用WordNet计算未知词汇的情感倾等用户生成内容的数量不断增长,对海量文本进行批向性;Pang等人对电影评论的数据按照倾向性分成量的情感倾向性识别已经日益成为一种极其迫切的需两类,利用人工标注了文本倾向性的训练语料,基于要。通过对带有情感的主观性信息进行分析处理,可unigram和bigram等特征,学习分类器。近年来,跨以挖掘出人们的态度和见解,从而

8、为政府、企业或用户领域的情感倾向性识别也成为一大研究热点。目提供重

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。