欢迎来到天天文库
浏览记录
ID:31359846
大小:112.00 KB
页数:8页
时间:2019-01-09
《基于多种情感特征的网络文本倾向性判别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于多种情感特征的网络文本倾向性判别方法研究 摘要:网络文本的情感倾向性分析对于电子商务、网络信息安全、网络舆情等方面具有非常重要的意义。本文在对文本倾向性分析的常用方法作了分析和研究的基础上,提出了一种综合情感词语、否定词、程度副词、关联词和词句类型等多种特征计算词句的极性值,进而判别文本情感倾向性的方法。实验结果表明,与ku提出的算法相比,该方法更能有效地判定文本情感倾向性。 关键词:情感词典;情感特征;网络文本;文本倾向性;倾向性分析 中图分类号:TP391文献标识码:A文章编号:1009-3044
2、(2015)22-0018-04 Abstract:Theanalysisofthesentimentorientationofthenetworktextisveryimportantfortheelectroniccommerce,thenetworkinformationsecurity,thenetworkpublicopinionandsoon.Inthispaper,thegeneralmethodoftextorientationanalysisisstudied.Weproposeanewme
3、thodtocalculatethepolarityvalueofthewordsandtojudgethesentimentorientationoftext,whichcomprehensivesavarietyofcharacteristics,suchastheemotionalwords,negativewords,adverbsofdegree,relatedwords,andsoon.Theexperimentalresultsshowthattheproposedmethodismoreeffe
4、ctivethantheKualgorithmforjudgingsentiment8orientation. Keywords:sentimentlexicon;sentimentfeature;networktext;textorientation;orientationanalysis 随着互联网的飞速发展以及网络信息交流的便捷性和信息传播的迅速性,使得越来越多的人使用网络作为信息交流的平台,发表自己的意见和观点。由此产生了大量带有个人主观情感色彩的在线文本,如个人博客、产品评论、新闻评论等。在这些浩
5、如烟海的大量文本中,大多数都带有作者对人、事、物的观点和态度。提取这些反映着网民真实观点和态度的情感信息,对于电子商务、网络信息安全、网络舆情等方面具有非常重要的意义。 网络文本倾向性分析是指通过采集、组织和分析这些网络文本中的立场、观点、看法、态度、情绪等主观信息,从而对文本的情感倾向性做出正负褒贬的判断。目前,这一技术已成为信息处理领域的一个研究热点,已被广泛应用在信息检索、信息过滤、信息安全、自动文摘等多个方面。 1相关研究 文本情感分析可以分为基于机器学习的情感分类方法和基于语义理解的情感分析方法
6、两大类。 基于机器学习的情感分类方法利用训练语料对分类器进行训练,然后将测试语料用已训练好的分类器进行分类测试,得到文本的情感倾向性。例如,Pang等[1]运用朴素贝叶斯网络、最大熵模型和支持向量机三种分类器对于影评进行了分类研究;李素科等[2]针对监督学习分类的不足之处,对情感特征进行聚类,并提出了一种半监督式的情感分析算法。8 基于语义理解的情感分析又可以分为两类:基于情感词的倾向性分析方法和基于语义规则的倾向性分析方法。基于情感词的倾向性分析首先抽取出文本中的情感词,然后对情感词逐一进行情感倾向判断,
7、得到各自的情感倾向值,最后通过累加这些倾向值获得文本最终的情感倾向和强度。例如,徐琳宏等[3]采用HowNet作为基准词,并在实验中考虑否定词和程度副词的影响,计算待测词与关联度确定语义倾向,对电影评论进行了倾向性识别研究。基于语义规则的倾向性分析首先建立一个情感倾向语义模式库,然后将文本按照这个语义模式库进行模式匹配,计算得到一系列情感倾向值,最后将这些倾向值进行累加,得到整个文本的情感倾向和强度。例如,Ku等[4]对新闻和博客文本从词级、句子级和文档级进行了意见抽取,得出观点摘要,进而对文本进行情感倾向和强
8、度分析。 对上述几种文本倾向性分析的常用方法进行深入的分析和研究后发现,许多方法只是片面地进行文本倾向性的判定,其准确性和有效性得不到保证。本文在精心构建基础情感词典和网络情感词典的基础上,根据网络文本的组成特点,综合利用情感词语、否定词、程度副词、关联词和词句类型等多种特征计算词句的情感极性值,据此判别文本情感倾向性。实验结果表明,该方法提高了网络文本倾向性判别的准确性。 2情感
此文档下载收益归作者所有