基于词向量的文本分类算法研究与改进

基于词向量的文本分类算法研究与改进

ID:35106487

大小:7.49 MB

页数:68页

时间:2019-03-18

基于词向量的文本分类算法研究与改进_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于词向量的文本分类算法研究与改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2016届研究生硕±学位论文102〇y分类号:学校代码:密级:学号:51131211005(1户)攀露嗦綾《錢冉EastChinaNormalUniversityg预±等恆巧交MA^STERSDISSERTATION’c...1’论文题目:某于词向貴的义太分类貸法研究与改进院系:计覚化科学与软件工程学院'专业:计貸化应用巧术Web应用技术研巧方向:指导教师:郑媒教授、.,?学位申请人:韦明亚

2、、,:占’:."2016年5月翁难I一/'试儀2016届研究生硕±学位论文分类号:码:10269学校代51215密级:号:131100学馨H巧於乂學EastChinaNormalUniversity硕:t学位论文’MASTERSDISSERTATION论文题目:基于词向量的文本分类算法研究与改进院系:计算机科学与软件工程学院专业:计算机应用技术研巧方向:Web应用技术指导教师:郑

3、媒教授学位申请人:王明亚2016年05月20日Dissertatio打of2016MasterDegreeSchoolCode:10269SUidentID:51131211005EastChinaNormalUniversityTitle:RESEARCHANDIMPROVEMENTONTEXTCLASSFICATIONBASEDONWORDEMBEDDINGDeartment:SchoolofCompu

4、terScienceandpSoftwareEngineeringMaor:ComputerTechnologyjResearchDirection:ApplicationTechnologyofWebSuervisor:ZhengJunpCandidate:MingyaWang*Ma202016y,华东师巧大学学位论文巧创性声巧郑重声明:本人呈交的学位论文《基于词向量的文本分类算法研究与改进》,是在华东师范大学攻读硕±

5、专业学位期间,在导师的指导下进行的研究工作及取得的研究成果,己经发表或撰写过的研究成。除文中己经注明引用的内容外本论文不包含其他个人果。对本文的研究做出重要贡献的个人和集体,均己在文中作了明确说明并表示谢意。化韦心WIi作者签名:跨日觀年技月日华东师想大学学位论文着作权使用声巧《基于词向量的文本分类算法研究与改进》系本人在华东师范大学攻读学位期间在。导师指导下完成的硕±专业学位论文,著作权归本人所有本人同意华东师范大学根据相关规定保留和使用此学位论文,并向主管部口和

6、学校指定的相关机构送交学位论文的印刷版和电子版、借阅同意;允许学位论文进入华东师范大学图书馆及数据库被查阅;学校将学位论文加入全国博±、硕±学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于(请勾选)""""*()1或,.经华东师范大学相关部口审查核定的内部涉密学位论文于年月日解密,解密后适用上述授权。(y)2.不保密,适用上述授权。导师答名本人篇名辦玉■レ如《化年扛月曰""*

7、涉密学位论文应是已经华东师范大学学位评定委员会办公室或保密委员会审定过的学位""论文(需附获批的《华东师范大学研巧生申请学位论文涉密审批表》方为有效),未经上述部口审定的学位论文均为公开学位论文,默认为公开学位论文,均适用。此声明栏不填写的上述授权)。王明亚硕±学位论文答辩委员会成员名单姓名职称单位备注朱敏高级工程师华东师范大学主席陈志云副教授华东师范大学赵俊逸高级实验师华东师范大学华东师范大学研究生硕±学位论文内容摘要随着信息

8、技术的日益发展,人类面临的数据量迅速增长。如何从海量数据资源中,准确、快速、全面地找到所需的相关信息,己经成为信息技术领域的重点研究课题。文本分类是文本挖掘领域的重要技术之一,为信息检索和高效管理海量数据提供了便利,具有重要的研究价值和意义。本文主要研究了文本分类的若干关键技术,包括文本预处理、文本表示模型、特征选择算法和分类算法。本文在详细了解和深入研究了上述过程的基础上,还重点研究了Google开源的基于深度学习的词向量训练工具word2vec工作原理,并将其应用到传

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。