欢迎来到天天文库
浏览记录
ID:33473951
大小:406.78 KB
页数:71页
时间:2019-02-26
《基于语义技术的中文信息情感分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TP391.1国际图书分类号:681.37管理学硕士学位论文基于语义技术的中文信息情感分析方法研究硕士研究生:林斌导师:卢涛副教授申请学位级别:管理学硕士学科、专业:管理科学与工程所在单位:管理学院答辩日期:2006年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.1U.D.C.:681.37ADissertationforMasterDegreeinManagementMETHODRESEARCHONSEMANTICTECHNOLOGY-BASEDCHINESEI
2、NFORMATIONSENTIMENTANALYSISCandidate:Supervisor:AcademicDegreeAppliedfor:Specialty:Affiliation:DateofDefence:Degree-Conferring-Institution:LinBinA.Prof.LuTaoMasterofManagementManagementScience&EngineeringSchoolofManagementJune,2006HarbinInstituteofTechnolog
3、y哈尔滨工业大学管理学硕士学位论文摘要面对网络上日益丰富的情感信息资源,如何能快速有效的获取并使用其中的有效信息成为人们关注的问题。本论文以影评信息领域的客户情感挖掘为例,通过使用一种以语义倾向分析为基础的信息挖掘技术来挖掘影评中用户透露的情感信息,藉此探讨语义倾向分析方法在面向互联网中文信息的客户情感分析中的作用。本文首先系统地介绍了文本分类的相关知识。通过对文本分类的基本概念、原理及相关技术的介绍,总结了文本分类领域的研究现状,为下一步方法的提出奠定基础。随后论文对语义分析的来源及原理作了简要地总结,从中英
4、文语言差异的角度出发,针对语义倾向方法在英文应用中暴露的问题,提出了改进,进而提出应用于中文的改进算法。最后的实验阶段论文运用影评测试文档对改进后的文档进行实测以验证改进后算法的正确性。为了验证改进后算法每个步骤的必要性,论文针对不同的步骤组合也进行了相关的实验。同时更加清晰地展现改进后算法的性能,验证改进的正确性,本文运用近年来广泛使用支持向量机技术进行性能的比较,并采用手机测试文档进一步测试比较两者的性能。本文在改进算法的同时,收集整理了相关的影评数据集和手机数据集,形成了一个可以共享的语料库。同时根据改进
5、后的算法,设计编写了一个情感信息分类系统,解决了中文情感信息的自动分类问题。语义倾向方法与训练型的文本分类算法相比,由于具有不需要大量样本训练、领域知识依赖弱的特点,相信在未来必能得到广泛的发展。关键词语义倾向;中文信息情感分析;评价文本分类;语义分析方法-I-哈尔滨工业大学管理学硕士学位论文AbstractInthefaceofabundantSentimentinformationresourcesdaybydayontheweb,howonecanobtainandutilizetheinformati
6、onfastandeffectivelyisbecomingaquestionthatpeoplepaycloseattentionto.Thispapergivesanexample,whichisaboutsentimentmininginthefieldofChinesemoviereviews.Andintheexample,aninformationminingtechniquethatisbasedonsemanticorientationisused.Thesemanticorientationa
7、pproachispopularwhenappliedtoEnglishsentimentminingwhileseldomusedinChinesesentimentmining.Andonthegroundsofanalysisoftheexample,wecanalsogetsomethingabouttheeffectsemanticorientationapproachhasonwebsentimentminingofChinesereviews.Firstly,thepapergivesafully
8、introductiononthetextclassification.Throughintroductiontotheconcept,principle,andrelatedtechnologyoftextclassification,thepapersummarizestherecentresearchontextclassification.Secondly,thepapergi
此文档下载收益归作者所有