欢迎来到天天文库
浏览记录
ID:37560840
大小:1.33 MB
页数:8页
时间:2019-05-25
《基于观点袋模型的汽车评论情感极性分类》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第29卷第3期2015年5月中文信息学报JOURNALOFCHINESEINFORMATIONPROCESSINGV01.29,No.3May.,2015文章编号:1003-0077(2015)03—0113—08基于观点袋模型的汽车评论情感极性分类廖健1,王素格1’2,李德玉1’2,张鹏1(1.山西大学计算机与信息技术学院,太原030006;2.山西大学计算智能与中文信息处理教育部重点实验室,太原030006)摘要:该文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句
2、子中的词性搭配关系,设计了12种抽取特征一观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果。关键词:情感分类;观点袋模型;词性搭配中图分类号:TP391文献标识码:ATheBag-of-OpinionsMethod
3、forCarReviewSentimentPolarityClassificationLIA0Jianl,WANGSugel“,LIDeyul”,ZHANGPen91(1.SchoolofComputer&InformationTechnology,ShanxiUniversity,Taiyuan,Shanxi030006,China;2.KeyLaboratoryofComputationalIntelligenceandChineseInformationProcessingofMinistryofEducation
4、,ShanxiUniversity,Taiyuan,Shanxi030006,China)Abstract:Focusedontheonlinereviewsentimentpolarityclassificationproblem,amulti—levelsentimentclassifica—tionmethodisproposedbasedonbag—of-opinionmodelandasetoflinguisticrules.AccordingtOtheparbobspeechofeachwordinthese
5、ntences,12patternsaredesignedforthefeature-opinionpairs’extraction,whichenabletore—presentthewholetextinaseriesoffour-tupleof“feature,degreeword,opinionword,negationword”.Afterde—signingtheestimationofthesentimentpriorityofthe{our-tuple,thecosinesimilarityisfurth
6、eradoptedfora5-levelsentimentpolarityclassification.ExperimentsonthedatasetfromCOAE2012Task3cardatasetindicateagoodre—sultcomparedtOtheperformancesoftheotherrunsinCOAE.Keywords:sentimentclassification;bagofopinion;POScollocation1引言随着互联网的快速发展,普通网络用户已经从单纯的信息接受者逐渐变成
7、信息生产者,各类微博、论坛、电商中存在大量具有评论性和主观倾向性的文本,例如商品评价、跟帖等。据统计,44%新闻文本包含观点信息[1]。通过分析商品评论,可以让普通用户更容易了解某些产品的主流市场评价,方便用户做出更正确的消费决定,对商家而言,也能利用这类结果来获得最直观的市场反馈,据此做出更有针对性的市场决策。篇章级文本通常包含了作者的多种观点,特别是关于产品的评论可能涉及到产品的多个方面,这些方面的倾向性有时并不一致。例如,“路虎的动力强劲,但油耗太大。”,分别从动力和油耗两个方面表达了完全相反的情感倾向。因此,综合
8、考虑产品的各方面的评价观点是进行篇章级文本的倾向分类研收稿日期:2013—04—08定稿日期:2013—07—31基金项目:国家自然科学基金(61175067,61272095);山西省自然科学基金(2010011021—1,2013011066—4);山西省科技攻关项目(20110321027—02);山西省留学基
此文档下载收益归作者所有