资源描述:
《情感分类中情感词的情感倾向度的计算方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、情报学报摇摇摇ISSN1000-0135JOURNALOFTHECHINASOCIETYFORSCIENTIFICANDTECHNICALINFORMATIONISSN1000-0135第28卷第3期292-298,2011年3月Vol.28No.3,292-298March2011試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試試doi:10.3772/j.issn.1000-0135.2011.03.0091)情感分类中情感词的情感倾向度的计算方法研究李摇纲摇王
2、忠义摇寇广增(武汉大学信息管理学院,武汉430072)摘要摇摇情感分类由于具有广泛的应用价值,成为当前的一个研究热点,然而情感词的情感度的准确确定一直是影响情感分类准确性的关键。本文针对当前情感词情感度确定中存在的问题和不足,提出一种基于改进的模糊层次分析法的情感词情感度的计算方法。该方法充分发挥了人和计算机的优点和长处,既能提高情感词情感度确定的科学准确性和情感检索的精准性,又可以减轻人的负担。关键词摇摇情感分类摇情感倾向度摇模糊层次分析法ResearchonComputingMethodforSentime
3、nt爷sIntensityinSentimentClassificationLiGang,WangZhongyiandKouGuangzeng(SchoolofInformationManagement,WuhanUniversity,Wuhan430072)Abstract摇摇Asthesentimentclassificationhasawidespreadapplicationvalue,soithasbecomeacurrentresearchhotspot.However,todeterminethe
4、emotion爷sdegreeexactlyhasalwaysbeenthekeytothesentimentclassification.Inviewoftheproblemsexistinginthecurrentcomputingmethodsoftheemotion爷sdegree,thispaperproposesamethodtocomputetheemotion爷sdegreebasedontheimprovementFAHP.Thismethod,whichhasfullyusedthepers
5、onandcomputer爷smerits,bothcanimprovetheaccuracyofthedeterminationoftheemotion爷sdegree,andrelieveperson爷sburden.Keywords摇摇sentimentclassification,sentiment爷sintensity,fuzzyanalytichierarchyprocess得较好的结果,但是,对于结构复杂的语句,统计学1摇引摇言方法在情感分类中就具有很大的不确定性,不能取得理想的效果。而二元或三元
6、的简单分类也不能很情感分类由于其具有广泛的应用价值成为当前好地满足人们对情感信息的需求。造成这些问题的的一个研究热点,同时由于其涉及自然语言处理因根本原因在于人们还无法准确界定语词在上下文语此也是一个研究难点。自从20世纪90年代情感分境中的情感倾向度。当前,关于情感词的情感倾向类被提出以来,情感分类的研究取得了许多突破性度的确定主要包括以下几种方法:布尔型特征权重、[1~8][6]进展。然而,通过分析我们也不难发现情感分词频型特征权重、基于基准词的方法和人工评价[9]类主要采用基于统计的方法进行情感词、情感句
7、以标注法。布尔型特征权重和词频型特征权重虽然及文本级的情感倾向的简单的分析判断,主要是进比较简单,但他们没有区分不同情感倾向度的语词行二元(正面,反面)或三元(正面,反面,中立)的粗的权重在情感区分中的能力,只是对情感词进行粗糙分类。统计学方法虽然对结构简单的句子可以取糙的赋值;基于基准词的方法的优点是可以计算机收稿日期:2009年12月23日作者简介:李纲,男,1966年生,毕业于武汉大学信息管理学院情报学专业,博士,武汉大学信息管理学院副院长,教授,博士生导师,主要研究领域:情报学、竞争情报。王忠义,男19
8、82年生,武汉大学信息管理学院情报学专业在读博士生,主要研究领域:数据挖掘,知识管理,信息组织与检索。E鄄mail:wzywzy13579@yahoo.com.cn。寇广增,男,1983年生,武汉大学信息管理学院管理科学与工程专业在读博士生,主要研究领域:数据挖掘、自然语言处理。1)摇本文系国家自然科学基金项目“文本集特征提取方法及应用研究冶(项目编号:70673070)的研究成果之一