欢迎来到天天文库
浏览记录
ID:53726845
大小:310.60 KB
页数:4页
时间:2020-04-20
《面向情感倾向性识别的特征分析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第24卷第9期计算机技术与发展Vo1.24No.92014年9月COMPUTERTECHN0LOGYANDDEVELOPMENTSep.2014面向情感倾向性识别的特征分析研究李妍坊,许歆艺,刘功申(上海交通大学信息安全工程学院,上海200240)摘要:随着互联网和信息技术的迅速发展,网络上用户的评论信息越来越多。利用计算机技术分析网络中大规模文本的情感倾向,在政府的舆情分析和企业的产品评价智能回馈等应用中有着非常巨大的发展前景。文中着重研究了选取不同的文本特征对文本情感倾向性分类精度的影响。实验中所研究的不同文本特征主要包括情感词、形容词、副词、语气词和
2、标点符号等。实验结果表明,选取情感词、形容词、副词作为特征项对情感分类具有较好的效果,在此基础上添加语气词和标点特征可以有效地提高情感分类的精度。该研究成果可用于社会舆情分析、垃圾博客过滤、商晶评论与推荐、影视评价等领域。关键词:情感分析;文本分类;特征选取;支持向量机中图分类号.TP31文献标识码:A文章编号:1673—629X(2014)09-0033—04doi:10.3969/j.issn.1673—629X.2014.09.007ResearchonFeatureAnalysisOrientedTextSentimentIdentificatio
3、nLIYan-fang,XUXin-yi,LIUGong—shen(SchoolofInformationSecurityEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)Abstract:Withtherapiddevelopmentofthelnternetandinformationtechnology,theonlinecommentsofusersfirealsoincreasing.Usingcomputertechnologytoanalyzeemotionalmndenc
4、iesoflarge—scalenetworktextsinthegovernment’spublicopinionanalysisandevalu—ationofthecompany’sproductapplicationssuchasintelligentfeedbackhasenormousdevelopmentprospects.Mainlystudytheinfluenceofselectingdifferenttextfeaturesonthefinalclassificationaccuracyofsentimentclassificatio
5、ninthispaper.Differenttextfeaturesstudiedintheexperimentincludeemotionalwords,adjectives,adverbs,modalandpunctuation.Theexperimentalresultsshowthatselectingemo—tionalwords,adjectives,adverbsasfeatureitemsonsentimentclassificationcanachievegoodclassificationperformance,andaddingmo—
6、dalandpunctuationfeaturescanefectivelyimprovethesentimentclassificationaccuracy.Theresearchfindingscanbeappliedtosocialpublicopinionanalysis,filteringspamblog,commodityreviewsandrecommendations,filmevaluationandsoon.Keywords:sentimentanalysis;textclassification;featureselection;SV
7、MO引言词语、句子、篇章情感倾向性识别。在国外,Kim等当今时代,随着互联网和信息技术的迅速发展,越人将工作重点放在情感词[的倾向性分析上,在基准来越多的人把网络作为社交平台,网络上的评论文章词集的基础上使用WordNet计算未知词汇的情感倾等用户生成内容的数量不断增长,对海量文本进行批向性;Pang等人对电影评论的数据按照倾向性分成量的情感倾向性识别已经日益成为一种极其迫切的需两类,利用人工标注了文本倾向性的训练语料,基于要。通过对带有情感的主观性信息进行分析处理,可unigram和bigram等特征,学习分类器。近年来,跨以挖掘出人们的态度和见解,从而
8、为政府、企业或用户领域的情感倾向性识别也成为一大研究热点。目提供重
此文档下载收益归作者所有