欢迎来到天天文库
浏览记录
ID:5344350
大小:219.47 KB
页数:3页
时间:2017-12-08
《新闻报道文本的情感倾向性研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第36卷第15期计算机工程2010年8月VoL36No.1sComputerEngineeringAugust2010·博士论文·文章编号:1000-3428(2010)i;02-_0—丽———西■新闻报道文本的情感倾向性研究昝红英,郭明,柴玉梅,吴云芳(1.郑州大学信息工程学院,郑州450001;2.北京大学计算语言学研究所,北京100871)摘要:将机器学习中的经典分类方法与规则方法相结合,用以分析新闻语音文本的情感倾向,并判断其强弱。通过支持向量机分类器来研究特征选择方法及特征权重计算方法的组合对实验结果的影响。在实验过程中发现适当的结合规则后,实验结果在不同程度上都有了提
2、高,在KNN和Bayes分类器上做了对比实验,结果证实该方法的普适性。关健词:机器学习;特征选择;特征权重;支持向量机Research0nNewsReportr】]extSentimentTendencyZANHong—ying,GUOMing。,CHAIYu-mei,WUYun.fang(1.CollegeofInformationandEngineering,ZhengzhouUniversity,Zhengzhou450001;2.InstituteofComputationalLinguistics,PekingUniversity,Beijing100871)[Abst
3、ract]Thispaperusesmachinelearningtechniquescombinedwiththerulestosolvesentimentclassificationofnewstext,andresearchesafectionoffeatureselectionandfeatureweightsbasedonSupportVectorMachine(SVM)classifier.Experimentsshowthatcombinedwiththerules,experimentalresultisimprovedInordertotestuniversal
4、ityofthecombinedmethod,moreexperimentsbasedonKNNandBayesclassifieraredone.ResultsshowthatcombinedmethoddoesbetterthannotcombinedOlqeS.[Keywords]machinelearning;featureselection;featureweight;SupportVectorMachine(SVM)1概述征句,分析评论句的语义极性和极性强度。文献【5】研究多种在较长一段时期内,情感一直位于认知科学研究者的视分类器在中文情感分类中的表现,并且针对不同词
5、性的词做线之外。直到20世纪末期,情感作为认知过程重要组成部分特征来测试词性在不同类别文本(如影视、教育、房产、电脑、的身份才得到了学术界的普遍认同。手机)的情感分类中的重要性。文献[6】使用朴素贝叶斯和最大随着互联网的发展而迅猛地发展着,大量的文本充斥着熵方法进行新闻及评论语料的情感分类研究,通过实验认为网络。数量已大大超出了手工能够处理的极限。因此,对文二值作为特征项权重正确率较好,但不足之处就是未用SVM本的自动分析处理成为一项重要的工作。文本的情感分析成分类器。为自然语言处理的研究热点。3文本情感分析模型本文主要研究如何利用机器学习的方法结合规则的方法本文结合使用统计的方
6、法和简单的规则方法来对新闻语来对新闻文本的正负极性及其强弱进行分类。相比于文本,料进行情感分类,采用结合规则的方法是基于以下考虑:比如BLOG的文本,新闻文本有其自身的特点,本文就是抓(1)规则包含一些语意信息,这是统计所不具备的,且本住新闻文本的这些特点来抽取规则,并利用这些规则结合机文人工提取的规则又经过统计方法的筛选以提高规则覆盖语器学习的方法进行分类。料的正确率。2相关研究(2)统计方法可以整体衡量训练语料中词语出现的频度现阶段对文本情感的研究总体可分为2类:及分布等一些统计信息,并且能评价这些词语对分类的贡献(1)利用语言自身的特点,总结出一套规则,并利用这套大小。规则
7、来分析文本的情感”J。本文用规则的方法对测试语料进行第1次分类,分出规(2)利用统计学的方法,对文本中出现的词进行统计得出则能够覆盖的语料。第2次再将剩下的测试语料用统计的方统计信息来进行情感分析。J。法进行分类来提高分类效果。许多研究者从词、短语、句子,到篇章等多个角度来进基金项目:国家“863”计划基金资助项目(2007AA01Z198);国家行探索。例如文献[2IN用点对互信息(PMI)来对词的语义倾自然科学基金资助项目(60970083);国家社会科学基金资助项目向进行判
此文档下载收益归作者所有