基于svm和深度学习的情感分类算法研究

基于svm和深度学习的情感分类算法研究

ID:35058785

大小:2.62 MB

页数:59页

时间:2019-03-17

基于svm和深度学习的情感分类算法研究_第1页
基于svm和深度学习的情感分类算法研究_第2页
基于svm和深度学习的情感分类算法研究_第3页
基于svm和深度学习的情感分类算法研究_第4页
基于svm和深度学习的情感分类算法研究_第5页
资源描述:

《基于svm和深度学习的情感分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391.1密级公开UDC004.4学位论文编号D-10617-30852-(2016)-02018重庆邮电大学硕士学位论文中文题目基于SVM和深度学习的情感分类算法研究英文题目ResearchonAlgorithmofSentimentClassificationBasedonSVMandDeepLearning学号S130231018姓名黄志勇学位类别工程硕士学科专业计算机技术指导教师杨富平副教授完成日期2016年5月30日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注

2、和致谢的地方外,论文中不包含他人已经发表或撰写过的研究成果,也不包含为获得重庆邮电大学或其他单位的学位或证书而使用过的材料。与我一同工作的人员对本文研究做出的贡献均已在论文中作了明确的说明并致以谢意。作者签名:日期:年月日学位论文版权使用授权书本人完全了解重庆邮电大学有权保留、使用学位论文纸质版和电子版的规定,即学校有权向国家有关部门或机构送交论文,允许论文被查阅和借阅等。本人授权重庆邮电大学可以公布本学位论文的全部或部分内容,可编入有关数据库或信息系统进行检索、分析或评价,可以采用影印、缩印、扫描或拷贝等复制手段保存、汇编本学位论文。(注:保密的

3、学位论文在解密后适用本授权书。)作者签名:导师签名:日期:年月日日期:年月日重庆邮电大学硕士学位论文摘要摘要互联网的蓬勃发展,引发了传统生活方式、商业经济结构的巨大变革。从电子商务、社交软件、再到打车软件,处处标示着互联网的标签。人们通过微信、微博等社交工具联络他人、展示自己、发表评论。藉此产生了大量蕴含着观点和意见的数据信息,具有难以估量的价值,这使得文本大数据处理成为当前非常热门的领域。文本数据的情感分类是该领域相关研究的主要内容之一,本文以文本情感信息分类为主要研究对象,针对目前中文情感分析领域,基于机器学习的相关研究在进行特征提取时通常基于

4、统计学的知识,存在对复杂句式有效分析能力不足和无法深入反映文本语义的问题进行深入研究。针对复杂句式有效分析能力不足的问题,本文构建了对应各种复杂句式的特征提取规则,提出了基于SVM(SupportVectorMachine)和复杂句式的文本情感分析方法。在实验中以情感词、词性和否定词特征组合为基础,依次加入条件句式和转折句式特征,并使用不同分类器及内核进行多次实验,得到的最佳分类结果为90.12%。同时,在实验中发现这类方法非常依赖人工设计的具体任务的特征,领域适应性差,难以覆盖所有的信息。针对无法深入反映文本语义与本文上述研究中发现的问题,本文引

5、入了基于深度学习的Word2vec工具,它能训练出包含着深层语义信息的低维词向量。研究中,使用Word2vec训练词向量作为特征,融合TF-IDF(TermFrequency–InverseDocumentFrequency)训练的词频权重特征,使用SVM分类器获得了理想效果。进一步调整惩罚系数C,当C=10的时候,获得的最佳准确度高达94.37%。同时,本文还提出了词向量融合Hash映射特征的方法,同样取得了良好的分类性能。通过本文的研究,使用传统的统计特征加上复杂句式特征,比单独使用统计特征组合提高了7.16%的准确度。本文进一步引入深度学习思

6、想,使用词向量作为特征,在融合统计特征之后大幅增进了情感分类的性能,准确度比前者提高了4.25%,正面评论的评价指数都获得大幅提升。基于上述研究,本文设计并实现了一个文本情感分析系统,主要包括数据预处理、分词、情感分类以及结果展示等功能。关键词:情感分析,SVM,Word2vec,深度学习,复杂句式I重庆邮电大学硕士学位论文AbstractAbstractWiththerapiddevelopmentoftheInternet,thetraditionallifewaysandcommercialstructurehavebeenchangeddr

7、astically.Frome-commerce,socialsoftware,andthentaxiAPP,Internetiseverywhere.Peoplecontacteachother,showthemselvesandmakecommentsthroughWeChat,micro-blogandothersocialnetworkingtools.Asaresult,massdatahavebeenproducedbytheseapplications,whichcontainsalargenumberofviewsandopinio

8、nsthathaveinestimablevalue.Thismakeslargetextdataprocessingbe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。