基于递归神经网络的生物医学命名实体识别

基于递归神经网络的生物医学命名实体识别

ID:35070848

大小:5.58 MB

页数:59页

时间:2019-03-17

基于递归神经网络的生物医学命名实体识别_第1页
基于递归神经网络的生物医学命名实体识别_第2页
基于递归神经网络的生物医学命名实体识别_第3页
基于递归神经网络的生物医学命名实体识别_第4页
基于递归神经网络的生物医学命名实体识别_第5页
资源描述:

《基于递归神经网络的生物医学命名实体识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、乂连键大聋DALIANUNIVERSITYOFTECHNOLOGY硕王等恆巧义MASTERALDISSERTATION幽K;基于递归神经网络的生物医学命名实体识别学掛专业计算机应用技术作者姓名金直互抬导巧肺李丽双教授2〇166_^__1_答辩日期硕壬学位论文基于递归神经网络的生物医学命名实体识别NamedEntitiesRecognitionBasedonRecurrentNeuralNetwork

2、inBiomedicalLiteratures;金留可作者姓名学科、专业:计算机应用技术学号:21309177指导教师;李丽双教授完成日期:2016年6月7日夫連巧义乂缘DalianUniversityof了echnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中己经注明引用内容和致谢的地方外,本论文不包含其他个人或集体£]经发表的研究成果

3、,也不包含其他&申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:A旬钟爲.痛各施换良喀呼命咳呼如抑:■作者签名:日期>,,,/《年月化日f_令彌4大连理工大学硕±学位论文摘要生物医学领域中的诸多信息抽取任务,如关系抽取、文本分类、指代消解W及事件抽取等。目前的命名实体识别方,往往需要预先识别出文本中表示指定类型的实体名称法需要丰富的领域

4、专家知识,,抽取大量人工特征。为了降低这些人工设计耗费的代价本文基于预训练的词向量和递归神经网络,提出简单有效的生物命名实体识别方法并;一系列扩展和改进对神经网络进行,提高对实体的识别性能W及在不同语料集上的适应性。首先,在传统递归神经网络(RNN)的基础上,,对隐层和输出层同时采用递归计算,使隐藏层记录前文的历史信息;而输出层可建立起标记之间潜在的依赖关系。同时为了弥补在对句子划分子序列时导致的上下文信息缺失,利用布朗聚类算法和狄利克雷(LDA)算法构建特征层模式化范

5、围更广的上下文语义信息。最后,组合两个方向相反tF-的单向RNN进行生物医学文本中的命名实体识别,在BiocreaiveIIGM语料上的值〇达到了83.62/〇。其次一,为了进步提高命名实体识别的效果,克服RNN在处理过长句子时存在的(L),LTM梯度弥散问题,STM网络结构此基础上S采用长短时记忆;并在构建了双向LSTM递归神经网络。另外微调词向量的过程会导致预训词向量信息的丢失,本文巧)提出采用两套不同的词向量扩展LSTM结构单元;并根据两套词向量差值计算出句子语

6、BLSTM-义向量表示,从而构建出融入句子向量和双向词向量的(STBLSTM)递归神-经网络,本文的方法达到了88.61%的F值,比采用词典。在BiocreativeIIGM语料上一140%与分类器组合及后处理的评测第名系统提高了.。,综上,本文主要采用了两种不同的递归神经网络进行命名实体识别避免了抽取人工特征时的代价-BLSTM递归神经网络具有更好的识别性能和适应。同时,提出的STRNN-,BiocteIIGM499性:与传统的相比它在reaiv语料上的F值

7、提高了.%而与采F-1.33%用丰富人工特征的基于浅层机器学习方法的系统相比,值提高了。关键词:命名实体识别;词向量;递归神经网络;甸子向量;长短时记忆--I大连理工大学硕+学位论文NamedEntitiesRecognitionbasedonRecurrentNeuralNetworkinBiomedicalLiteraturesAb巧ractI-ntnbiomedical打eldrecoizindifferenttesofe

8、ntitiesishe行rstsl;einanumberof,ggyppinformatio打extractiontaskssuchasrelationextraction1:extclassificationcoreference,,resolutionandeventextractio打.For化ecurrentexistingmethods,richdomainexpertknowledgeandamou

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。