互联网评论文本情感分析分析

互联网评论文本情感分析分析

ID:32184628

大小:2.63 MB

页数:50页

时间:2019-02-01

互联网评论文本情感分析分析_第1页
互联网评论文本情感分析分析_第2页
互联网评论文本情感分析分析_第3页
互联网评论文本情感分析分析_第4页
互联网评论文本情感分析分析_第5页
资源描述:

《互联网评论文本情感分析分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据山东大学硕士学位论文摘要随着信息技术和互联网的飞速发展,越来越多的互联网用户在各种网站上分享经验和发表评论,这些评论文本表达了评论者的观点和情感,用户也习惯于从互联网的各种评论中获取信息,为自己的某些决策寻找参考意见。分析用户发表在互联网上的评论,能够发现用户情感的演化规律,挖掘其中的潜在信息,具有巨大的应用价值。但是目前互联网上的信息量增长迅速,我们迫切需要借助自动化工具,在大量的信息来源中迅速获取我们真正需要的信息,从而应对信息爆炸带来的挑战。如何对这些包含大量信息的互联网评论文本进行情感分类、挖掘其中蕴含的情感信息是自然语言处理领域的研究难点,也已成为商业

2、智能领域的关注热点,由此引发众多研究人员进行相关研究,文本情感分析相关技术应运而生。文本情感分析是一个综合性的研究领域,目前主流的研究方法分为两种类型:无监督的文本情感分析和有监督的文本情感分析。无监督的文本情感分析主要是运用情感词的相关信息进行文本情感倾向判别,有监督的文本情感分析主要是运用朴素贝叶斯、支持向量机等有监督学习算法进行情感分类,一般是将文本集合划分为训练集和测试集,再对文本分词处理、删除停用词、选取特征,将文本表示成为文本向量的形式,最后训练分类器并进行分析。本文在针对无监督学习中文文本情感分析的研究中使用中文情感极性词典NTUSD和HowNet词典的并

3、集组成基础词典,使用微软云平台提供的BiIlgSearchAPI,并改进开源Python库使之支持中文和查询结果缓存,在中文语料库上改进并实现了SO—PMI.IR算法。在此基础上提出了针对上述基础词典进行筛选的SO.PMI.Lexicon算法,通过调节SO.PMI闽值,保留其中有明显情感倾向的词,提高了分类准确率。在针对有监督学习中文文本情感分析的研究中,对数据挖掘工具Weka进行二次开发,对电商评论语料库应用主流的有监督学习算法(SVM,NaiveBayes,DecisionTree)得到基准实验结果,并尝试将语料库中每个有意义词的正则化的SO.PMI值作为文档向量的

4、权值,改进了SVM算法的运行效率。关键字:情感分析;情感词典;点互信息;机器学习万方数据山东大学硕士学位论文ABSTRACTWimtherapiddevelopmentofinformationtechnologyandInteract.moreandmorepeoplesharetheirexperiencesandwritereviewsonvariouswebsites.Thereviewsexpressopinionandemotionofreviewers.Peopleareaccustomedtoobtaininformationfromthereviews

5、onInteractandtheysometimesmakedecisionsbasedonit.WeCanfindtheevolutionofreviewers’emotionbyanalyzingthereviewspublishedonInternet.Miningpotentialinformationofithasgreatapplicationvalue.Nowadays,weurgentlyneedtouseautomationtoolstogaintheinformationweexactlywantfromthelargeamountofinforma

6、tiononIntemet.SOastOcopewi廿1thechallengesofinformationexplosion.Howtorecognizethecomments’sentimentanddiggingpotentialinformationfromthehugemassofcommenttextishighlychallengingasaNaturalLanguageProcessingresearchtopic.Ithasalsobecomeafocusinthefieldofbusinessintelligence,whichcausedmanyr

7、esearcherstoconductresearch.ThesentimentanalysisoftheInternetreviewsemergedasrequired.ResearchonsentimentanalysisofInternetreviewsisacomprehensiveresearchfieldwhichinvolvesmultipledisciplines.Themainresearchmethodsaredividedintotwotypes:sentimentanalysisusingunsupervisedl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。