欢迎来到天天文库
浏览记录
ID:23525240
大小:52.00 KB
页数:5页
时间:2018-11-08
《基于特征的非正式短文本情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于特征的非正式短文本情感分析研究黄正伟①HUANGZheng-eta-levelfeatures)的文本情感分类方法。Anjaria提出一个有监督基于支持向量机朴素贝叶斯最大熵和人工神经网络的、利用直接和间接特征来提取文本观点。二是基于无监督(unsupervised)的情感极性分析研究。Terrana提出了一个利用推特中的情感符来自动分类文本情感极性的无监督的方法,Malandrakis研究了无监督的语义情感模型(semantic-affectivemodels)的自适应算法,Ou通过将微博间的链接分
2、类,提出一个无监督的内容和链接情感模型(CLUSM:ContentandLinkUnsupervisedSentimentModel)来作微博链接信息的情感分析。Li提出了无监督情感导向特征选择法(USFS:unsupervisedsentiment-bearingfeatureselectionmethod)来识别主观文档的不同情感倾向类别。Fu提出了一个无监督的多方面情感分析方法,它可以自动发现中国社会评论的不同方面以及各方面表达的情感。另外,也有一些研究是基于半监督的(semi-supervised
3、),例如Hassan提出把马尔科夫随机漫步模型运用到大量词关系图中来文本的情感极性,Kim提出通过半监督的非线性降维分类方法,可以通过递减的发觉的错误除去多余的特征。社交网络迅速发展,微博等非正式短文本充斥网络,本文在分析非正式短文本特征的基础上,提出利用依存句法来分析文本的情感极性。1建立模型基于特征的六元组模型:元组表示数据库中的一条记录,本文基于文本的语义特征建立六元组模型,该模型中不仅包含描述意见的特征,还包括词语间的修饰关系和标点符号。符号说明:T表示一个一般文本;是观点词o的修饰语的数量;s是
4、观点词o的修饰语的平均分数;n是观点词o的否定词的数量;p是语句的标点符号。在本文的六元组特征模型中,定义一般文本T={(v1,,s,n,p)(2)其中,修饰语o是表示程度的副词,如“非常”、“很”等,修饰语会影响文本所表达的情感,一个文本中往往具有多个程度副词修饰文本语义,在本文的算法中提取的是观点词附近的修饰语。通常来讲,一个观点词的修饰语和否定词的数量都不会超过2个,所以本文赋值(0,1,2)给m和n。修饰语的平均分数是指一般程度副词对每个观点词的平均分数。p是语句的标点符号,它能够反应的语气,通常
5、具有陈述、感叹、问句三种状态,本文把p作为一个单独的元组来考虑;陈述的情感比较弱,对于文本的情感极性影响较小,感叹和疑问的情感表达比较强烈,对文本情感极性影响较大,因此,当标点为句号时,p=0,当标点为叹号或者问号时,p=1。上述模型对进行文本分类的必要信息作了简要分析,其中观点词的修饰语的数量、观点词的否定词的数量和修饰语对观点词的平均分数作为变量,会影响文本的情感倾向。修饰语即程度副词表示情感极性的强度,否定词则可以改变观点词的极性。本文采用知网(Ho,包括语法树中直接与实词联系的修饰词以及与其连接的
6、所有子树中的修饰词;最后是从文本的依存关系中提取程度副词对观点词的平均分数s(即观点词对程度副词的依赖程度)和否定词的数量n。否定词可以修饰观点词,也可以修饰程度副词。m、n的值初始为零,副词和否定词是与观点词联系在一起的。每增加一个修饰词,m的数值增加1。同样,n随着否定词的数量增加而增加。本文计算每个与观点词相关的程度副词的平均分数作为s的值。最后,依据p来确定文本的语气。2.2文本情感倾向的判别提取情感元祖之后,接下来便是建立文本情感判别模型。用Vc表示核心词的情感值,初始值为1;VM表示修饰词的情
7、感值,初始值为0;VT表示情感元组的情感值。在情感值计算中,对知网情感词典的情感词赋值,正的情感词的情感值为1,负的情感词的情感值为-1。然后计算核心词和修饰词的否定程度Dmad,SentimentAnalysisofShortInformalText[J].JournalofArtificialIntelligenceResearch,2014.50:723-762.[2]DengZ.,K.Luo,H.Yu.Astudyofsupervisedtermeforsentimentanalysis[J].E
8、xpertSystemsarquez,F.,M.Mendoza,B.Poblete.Meta-levelsentimentmodelsforbigsocialdataanalysis[J].Knos.2014.69(SI):86-99.[4]OuG.,etal.,CLUSM:AnUnsupervisedModelforMicroblogSentimentAnalysisIncorporatingLinkInformation.
此文档下载收益归作者所有