资源描述:
《基于句法分析的跨语言情感分析_陈强何炎祥刘续乐等》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、北京大学学报(自然科学版),第50卷,第1期,2014年1月ActaScientiarumNaturaliumUniversitatisPekinensis,Vol.50,No.1(Jan.2014)doi:10.13209/j.0479-8023.2014.012基于句法分析的跨语言情感分析1,21,2,†11,21,21,2陈强何炎祥刘续乐孙松涛彭敏李飞1.武汉大学计算机学院,武汉430072;2.武汉大学软件国家重点实验室,武汉430072;†通信作者,E-mail:yxhe@whu.edu.cn摘要利用句法分析模型,将语句分成若干组合词,根据组合词的主谓成分中情感
2、词对于句子情感贡献的不同,分别赋予不同的权重。统计分析该语句的情感分布特征,利用得到的特征参数训练分类器,再将训练好的分类器用于测试语料的情感分类。实验结果表明,与已有的判别方法相比,该方法的情感分类判别准确率较理想。此方法也可用于语句的比较级判别和否定句的极性判断等。关键词跨语言;情感分类;句法分析;贝叶斯分类中图分类号TP391Cross-LanguageSentimentAnalysisBasedonParser1,21,2,†11,21,21,2CHENQiang,HEYanxiang,LIUXule,SUNSongtao,PENGMin,LIFei1.Schoo
3、lofComputerofWuhanUniversity,Wuhan430072;2.StateKeyLaboratoryofSoftwareEngineeringofWuhanUniversity,WuhanUniversity,Wuhan430072;†Correspondingauthor,E-mail:yxhe@whu.edu.cnAbstractUsingthesyntacticanalysismodel,thestatementisdividedintoseveralcombinationsofwords.Accordingtothesubject-predi
4、catecomponentofcompoundwordsandemotionalcolordifferenceofemotionalwords,differentweightsaregivenrespectively.Theauthorsstatisticallyanalyzethedistributionoftheemotionalstatement,usethecharacteristicparametertrainingtheclassifier,andemploythetrainedclassifierforthetestcorpusemotionalclassi
5、fication.Experimentresultsshowthattheemotionclassificationdiscriminantaccuracyrateandrecallrateofthismethodismoreideal,comparedwiththeexistingdiscriminationmethods.Thismethodcanalsobeusedinthestatementofcomparativediscriminationandnegativepolarityjudgment.Keywordscross-language;sentimenta
6、nalysis;parser;Bayesclassification[1]互联网(如社交网络、电子商务平台和论坛等)系。王根等使用CRF和冗余标签对句子序列进行上产生了大量的,用户参与的,对于人物、事件、产情感倾向性标注,这种方法的缺陷在于需要人工标品等有价值的评论信息。这些评论信息表达了人们注的语料进行训练,消耗大量人力。另一种是基于[2]的各种情感色彩和情感倾向,如喜、怒、哀、乐和句子结构的分析,薛丽敏等提出基于句法分析的批评、赞扬等。基于此,潜在的用户就可以通过浏5种结构用于情感倾向性识别。[3]览这些主观色彩的评论来了解大众舆论对于某一事跨语言情感分类方面,Wan
7、提出利用协同训件或产品的看法。随着文化交流的增加,多语种的练的方法,具体做法是:在中文情感语料及资源缺评价资源日益普遍,如何进行跨语言情感分析已成乏的情况下,利用已经标注的英文情感语料和翻译为自然语言处理的热点问题。工具,将未标注的中文评论语料翻译形成未标注的目前,对于语句情感倾向性的识别有多种方法,英文语料,再将已标注的英文评论语料翻译形成已句法分析方法的优势在于处理复杂语句时,能够很标注的中文评论语料。这样,就将中英文评论语料好地定位到情感词语及其修饰副词与评价对象的关看成两个独立的视图。然后,利用协同训练的方法,国家自然