欢迎来到天天文库
浏览记录
ID:51957650
大小:8.01 MB
页数:62页
时间:2020-03-20
《基于神经网络的文本倾向性分析系统的研究与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、J、7:咖j7:位^之V-j-沖巧卩彳化的(、小幼向忡分析系统的训究1训指导小组成员名单钱松荣教授兌R人'7:硕丨-7:位论t^j'-神纾网络的义木z顷向性分折系统的研艽勹实现目录摘耍IIAbstractIII第i章绪论11.1研究背景11.2选题意义21.3本文主要工作31.4本文结构3第2章文本倾向性分析概述42.1弓II42.2文本倾向性分析42.2.1词汇级的文本倾向性分析42.2.2句子和篇章级的文本倾向性分析72.3文本倾向性分析常用技术82.3.1分同82.3.2词性标注102.3.3VSM
2、向量空间模型112.3.4文本处理的一般流程132.4本章小结14第3章基于神经网络的网络舆情文本倾向性分析153.1弓唁153.2神经网络153.2.1神经网络的发展概述153.2.2神经元模型173.2.3BP神经网络训练模型183.3基于神经网络的文本倾向性分析算法的训练模型213.4文本的VSM权重类型选择223.5神经网络的各个参数确定233.5.1激活函数24feR人7硕丨:卞位论文fMm的x本傾向ft分析系统的w丨%勺实现3.5.2阈值253.5.3倾向词的初始权重的选取263.5.4
3、期望输出确定293.5.5误差函数及反馈313.6训练算法流禾呈333.7文本倾向性判定方法343.8算法复杂度分析343.9基于神经网络的文本倾向性分析方法框架353.10实验结果及分析363.11本章小结37第4章基于神经网络的情感词汇自动获取方法384.1弓丨言384.2基于神经网络的情感词汇自动获取方法384.2.1获取候选词表384.2.2神经网络训练414.2.3训练后的情感词词典的筛选414.3情感词词典的删减424.4基于神经网络的情感词汇自动获取方法框架424.5实验结果及分析
4、434.6本章小结44第5章基于神经网络的文本倾向性分析总体系统455.1基于神经网络的文本倾向性分析总系统455.2系统设计实现46第6章总结与展望486.1总结486.2基丁?神经网络的文本倾向性分析系统的应用前景486.3展望49参考文献51攻读学位期间发表的学术论文55‘乂丨1人、i‘uerf‘叻「〒“j丨vK'jx^致诎56S曰.大学硕七‘7:位论之-?丁?祌经网络的文本倾向忭分折系统的研究1j实现摘要随着信息时代的到来,数以亿计的网民通过参与和自治,逐渐形成以新闻评论、BBS、聊天室、博客、维基、聚合新闻、微博
5、等为代表的网络社区。广大网友以网上交流的形式已经形成了现今不容忽视的一大现象——网络舆情。对丁-网络舆情的研究是当前的一大热点。而对于网络评论的倾向性分析则是网络舆情研究中的重要课题。本文主要的创新点在于提出了对于情感词权重进行训练的思想;提出了基于神经网络的网络舆情文本倾向性分析系统,包括详细的算法部分以及引出的基于神经网络的情感词汇自动获取方法;整个算法在情感词词汇的自动获取方面能够做到全自动化,在篇章级的文本倾向性分析中的准确率较高,对于网络评论的倾向性能够进行全面系统的分析。在句子和篇章级的文本倾向性分析方面,研究者将主观文本的极性分为褒义和贬义两
6、类。目前主要有两种方法:基于情感知识的方法以及基于特征分类的方法。基于情感知识的文本倾向性分析方法使用知识库得到情感词典或领域词典,然后进行极性加权求和的方法来进行分析。基于神经网络的网络舆情文本倾向性分析算法属于该类算法:在已有的词典基础上使用神经网络训练的方法对于情感词倾向值词典进行更新,从而能够反映最新预料的特征,改进网络评论的倾向性预测准确度。我们通过实验进行测试,证明了本算法能够达到较好的准确率。情感词词典的更新一直是文本倾向性分析中的重要的研究课题,然而现有的更新情感词词典的算法或多或少都会需要人工的参与。鉴于此,我们提出了基于神经网络的情感词
7、汇自动获取方法,使用神经网络训练算法对统计得到的候选情感词进行训练,然后经过筛选得到更新后的情感词词典。本文对于算法进行了细致的描述,最后通过实验进行验证,证明了本算法能够自动获得情感词,同时对于文本倾向性的预测能够起到增加准确率的效果。最后,我们对于本文的工作进行了总结,同时对于将来的研究方向进行了展望,提出了几条后续的研究工作,望后续的学者能够继续本文的工作。关键字:倾向性分析,神经网络,文本处理,网络舆情中图分类号:TP311殳H大7:硕1:7位论ic?,t-J?忡经络的文本倾向性分析系统的研艽-'jAbstractWiththeInformatio
8、nagecoming,millionsofInternetuser
此文档下载收益归作者所有