基于优化的ig与rbf的svm文本情感分类研究

基于优化的ig与rbf的svm文本情感分类研究

ID:35060551

大小:3.18 MB

页数:65页

时间:2019-03-17

基于优化的ig与rbf的svm文本情感分类研究_第1页
基于优化的ig与rbf的svm文本情感分类研究_第2页
基于优化的ig与rbf的svm文本情感分类研究_第3页
基于优化的ig与rbf的svm文本情感分类研究_第4页
基于优化的ig与rbf的svm文本情感分类研究_第5页
资源描述:

《基于优化的ig与rbf的svm文本情感分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC:学号:406130913129南昌大学硕士研究生学位论文基于优化的IG与RBF的SVM文本情感分类研究ResearchonSVMTextSentimentClassificationBasedonOptimizationofIGandRBF马海亮培养单位(院、系):信息工程学院计算机科学与技术指导教师姓名、职称:段隆振教授申请学位的学科门类:工学学科专业名称:计算机科学与技术论文答辩日期:2016年5月24日答辩委员会主席:______________评阅人:________

2、______2016年月日一、学位论文独创性声明本人声明巧呈交的学位论文巧本人在导师指寻下进行的研究工作及取得的硏究成果。据我所知,除了文中特别加臥标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包舍为获巧爾吕大学或其他教島机构的学位或证书而视用过化材料一同工作的同志对本研究所化的任何贡,与我献均己在论文中作了明确的巧明并表示谢意。学位论文作者签皂(手写):盤字日綱!年矣月1/^日二、学位论文版权使用摸权书本学位论义作者完全了解南吕大学有关保

3、留、使用学位论文的规定同顆,学校有权巧围并向国家有关部口或机构送交论文的餐印件和电了版,允许论文被齊院和侣阔。本人援权南冨乂学可材将学泣论文的全部或部分内容编入令关数据库逊行检索,可凹采用影印、缩印或扫描等复制宇段保存、汇编本学泣论义。同时援权北京万方数据股份巧限公司和中围巧术期刊(化盘版)电了杂志社巧本学位论文化或到-《中圃学位论文全文截提库》和《中国优秀稱硕上学位’论文全文数据库》中全文发表,并通过网络向社会公众提供悟息服务同意按,""鸯程规定享受相式权益。。

4、学位论文作者签名(于写);_!可吝藏J导师籍名C手写)'签字[:|期^:1/居年^月WP签字曰期:於^年户巧^曰论文题目化丑支欄俩和的邮偏桶谷本愈矣哀种姓名学哥论文级别瞄+口:硕補(I男fc;!知快系化院//所专M跳:違撕片如《if像漸末每j=Email—I.-备单 ̄’担"’(方口假密向校学位办申请获批准为促密,年片后公巧)摘要摘要近年来网络信息随着互联网技术的发展在急剧增长,同时国家主席习近平也提出了互联网+的概念,因此在互联网中产

5、生了大量、且具有研究价值的文本信息,如互联网参与人员发表的关于个人态度的一些主观信息,包括立场、建议、情绪等。对这些数据进行挖掘和研究具有很大的价值。文本情感分类就是对文本信息进行分析、研究的一种方法,目前主要文本情感分析方法主要分为两类,基于语义理解和基于机器学习的文本情感分类,而本文正是对其中的基于SVM机器学习的相关方法及算法进行研究。在本文中所进行的研究工作主要有以下三个方面:第一,对信息增益(IG)特征选择方法进行深入研究,并对其目前存在的问题提出了相关解决办法和方案。首先本文通过对相关

6、文献的阅读和研究发现特征选择方法忽略了特征项在类别间和类别内分布对特征选择的影响,从而导致特征选择存在偏颇,因而本文在传统特征选择方法的基础上引入了类别内特征频率、类别间的特征频率两个计算因子,进而使其对文本特征进行更合理的选取,将此改进应用到文本情感分类中,寻求分类效率的提高,然后用实验进行分类结果验证。第二,对支持向量机(SVM)中核函数进行了研究,对常用的高斯核函数(RBF)进行微调,并将其应用到组合函数中。首先本文通过对基于SVM机器学习的文本情感分类的研究发现,核函数对将SVM文本情感分

7、类结果具有很大的影响,进而进一步的对常用几种核函数进行了深入研究,发现RBF具有很好的性能,且组合核函数性能比单核更好。但RBF存在着远离测试点处泛化、学习能力衰减过快的问题,因而本文对其进行微调,再利用组合核的思想将调优后RBF分别与多项式核函数(Polynomial)和Sigmoid核函数进行线性加权组合,从而提高分类性能和精度。第三,基于以上两点的改进与优化,本文优化了传统的基于SVM的文本情感倾向分类模型,经过实验后结果分析表明,基于本文方法优化的SVM文本情感分类方法具有更好分类性能和精

8、度。关键词:文本情感分析;SVM;信息增益;高斯核函数;组合核函数IABSTRACTABSTRACTInrecentyears,networkinformationhasgrowthrapidlywiththedevelopmentoftheITindustryandInternettechnology,meanwhile,PresidentXiJinpingputforwardtheconceptoftheInternetplus,therefore,alargenumberof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。