欢迎来到天天文库
浏览记录
ID:37084330
大小:5.06 MB
页数:67页
时间:2019-05-17
《基于改进的Word2vec的评论情感倾向性分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代号10532学号S1510W0635分类号TP391密级HUNANUNIVERSITY工程硕士学位论文基于改进的Word2vec的评论情感倾向性分析学位申请人姓名梁翼园培养单位信息科学与工程学院导师姓名及职称张伟助理教授刘华高级工程师学科专业计算机技术研究方向自然语言处理论文提交日期2018年5月15日学校代号:10532学号:S1510W0635密级:湖南大学工程硕士学位论文基于改进的Wo
2、rd2vec的评论情感倾向性分析学位申请人姓名:梁翼园导师姓名及职称:张伟助理教授刘华高级工程师培荞单位:信息科学与工程学院专业名称:计算机技术论女提交日期:2018年5月15日论女答辩日期:2018年5月26日答辩委员会主席:彭飞教授CommentsSentimentAnalsisBasedonImrovedWord2vecypbyLIANGYiyuanB.E.HunanFirstNormalUniversit)
3、2015(yAthesissubmittedinartialsatisfactionoftheprequirementsforthedegreeofMasterofscienceincomputertechnologyintheGraduateschoolofHunanUniversitySupervisorAssistantProfessorZhangWeiSeniorEngineerLiuHuaMa2018
4、y,湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研宄所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:緣餐夢日期:7^知t月必日学位论文版权使用授权书、本学位论文作者完全了解学校有关保留使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件
5、和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密□,在年解密后适用本授权书。2、不保密<-“”(请在以上相应方框内打V)作者签名:垛黷?日期:年夕月贫日导师签名:么曰期:年义月>曰{辞>丨38I基于改进的Word2vec的评论情感倾向性分析摘要词表示技术是深度学习在自然语言处理(NLP)领域的突破。词表示技术是
6、将词转化成为向量表示。词向量被广泛应用于各种NLP任务。Word2vec是Google一在2013年发布的款将词表示为实数值向量的高效工具。词语是文本中承载语义信息的最小单元。英文单词由字母组成,中文词语由汉字组成。借鉴英文词表示的方法,中文词表示引入了汉字的信息。研宄表明,将汉字的语义信息融入词表示中。但是现有的模型在考虑汉字,得到的词向量在某些NLP任务中取得了成功对词语的语义贡献程度上存在一习到的词向量在一定的局限性,使学些NLP任务一上表现的差强人意。针对这个问题,本文提出
7、了种基于注意力机制的词表示方法,,该方法利用《同义词词林扩展版》来计算字词间的语义相似度。实验证明通过该方法获得的词向量在词语的语义相关性实验上要优于现有的基线模型。并且将改进的Word2vec应用于微博评论的情感分析任务上也取得了较好的结果。本文具体的工作内容如下:一1.本文提出了种增量式的词向量学习方法,使其在面对语料库的新增内容时。,不需要重新训练所有的语料库,仅做由于新増数据所引起的更新2一CWE.本文提出了种基于注意力机制的字词联合训练模型A,利用词林来计算字词间的
8、语义贡献程度。通过语义相关性实验证明,本文提出的方法要优于现有的基线模型。3.将改进的Word2veC应用于微博评论的情感分析上,通过实验验证了改进后的Word2vec的有效性。关键词:W〇rd2vec感分析增量学习;同义词词林;;情;注意力n工程硕士学位论文AbstractWordembeddingtechnologyisabreakthroughinthef
此文档下载收益归作者所有