基于双向lstmn神经网络的中文分词研究分析

基于双向lstmn神经网络的中文分词研究分析

ID:35188101

大小:7.26 MB

页数:74页

时间:2019-03-21

基于双向lstmn神经网络的中文分词研究分析_第1页
基于双向lstmn神经网络的中文分词研究分析_第2页
基于双向lstmn神经网络的中文分词研究分析_第3页
基于双向lstmn神经网络的中文分词研究分析_第4页
基于双向lstmn神经网络的中文分词研究分析_第5页
资源描述:

《基于双向lstmn神经网络的中文分词研究分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:一r曾玲變...巧;.f../巧聲:;麵.;7年:J.运霞.蒙.掉%马^.蔡雜韓敏心,嘯..xf£.V:带兵>.r襄:技覆擁賣募識暴當.蘇S/.:#材MV产.警.r說泣.-;i讚私..調-...賣麗!細以碱/暴藏r知削藻烹’麵為缘.;.;鮮:繁庫V藝槪A變.;.生论b研究:t心;祖\少瑞节.#申扛杉立.户箸讀為苗,:-:.‘,々.-.,P..。一?:.,.瓣身^^鼓4巧麵神琴题昇,满':户^:I麵;暢5uC;K;\姓名讀:屬蘿取.?>.L苗齡I.部.u.;转-.,:.方向義訊魄

2、,尸-;J.接教师!f授....!\.:,:.!.r暮诲—V分。當咳八禱i;第篡繞如狼苗養狼占.v-t:巧;.游:?:雲.^:.^鍵沪言,於,#i:讀^:巍—-^.^i.滅..讀譯^声.带編:^d想藥I象|嚇¥續.学号:MGB32006论文答辩日期:2016年5月25曰指导教师;(签字)若心或一、基于双向LSTMN神经网络的中文分词研究分析作者:黄积杨指导教师:赵志宏教授南京大学研究生毕业论文(申请工学硕±学位)

3、南京大学软件学院2016年5月ChineseWordSegmentationAnalysisbasedonBidirectionalLSTMNRecurrentNeuralNetworkHuanJiYang,gSubminartialfulfllmthrirtrittedpientofeequemensfothedegreeofMasterofEnineeringgSuervisedbpyProfessorZhaoZhiHon,g

4、SoftwareInstituteNANJINGUNIVERSITYNaningChinaj,Ma16y,20南京大学硕±论文^摘要,利用算法实现分词的方法基本上是基于字典在2002年之前、词库匹配的。一在2002年发表了第篇基于字标注的分词论文,首次把中文分词抽象成序列生一成序列的问题,随后在些模型上实现的基于字标注的分词系统取得了不错的效果,如:最大滴模型、隐含马尔可夫模型、条件随机场模型、支持向量机模型等。目前主流的分词系统使用的是条件随机场模型。在

5、2006年深度学习的概念被提出,随后应用于计算机视觉、自然语言处理、语音识别等领域,,成功地取得诸多突破性的进展其中的递归神经网络更是被广泛运用于解决词性标注、翻译、命名实体识别等自然语言处理问题。把多数自然语言处理问题抽象成序列生成序列,并采用合适的递归神经网络结构处理,成为当前的热点和主流。基于字标注的分词本质上是序列生成序列的问题,因此本论文中,采用改进的双向长短期记忆神经网络实现中文分词。改进的长短期记忆单元与标准的长短期记忆单元不同在于,采用存储带来保存过去的信息,并通过注意

6、力机制合理利一用这些信息,个隐藏状态向量而造成的信息压缩避免仅仅向后传递。标准的长短期记忆神经网络能很好地解决词与词之间远距离的依赖关系,而双向长短期记一忆神经网络能捕获到句子中个词的上下文信息,从而网络结构能更好地理解语义并正确实现分词。同时提出标准双向长短期记忆神经网络层加注意力机制层的。方式实现中文分词,研究在不同位置上添加注意力机制对中文分词的影响关键词:深度学习、长短期记忆神经网络、中文分词、注意力机制I南京大学硕±论文abstractAbstractBefor

7、e2002themethodofwordsementationthatusinanalorithmtoimplement,ggg.isessentiallbasedonadictionarandthesaurusmatchingIn2002thefi巧taeraseyy,ppbonthewordlabeltosementationispublished.ForthefirsttimetheChinesewordg,segm

8、entationisabstractedastheproblemofsequencegenerationsequence.SubsequentlythewordsegmentationsystemthatimplementedbasedonwordlabelonsomemodeiltMEM.lshasachev

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。