欢迎来到天天文库
浏览记录
ID:37089530
大小:3.30 MB
页数:58页
时间:2019-05-17
《基于深度网络的药物关系抽取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391学校代码:10697:公开学号密级:201520987馨±字位i2文MA’STERSDISSERTATION基于深度网络的药物关系抽取算法研究学科名称:软件工程作者:冯筠教授:杜晓东指导老师西北大学学位评定委员会二〇—八年六月ResearchonDrug-DrugInteractionExtractionAlgorithmBasedonDeepNeuralNetworksAthesissubmittedtoNorthwe
2、stUniversityinpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareEngineeringByDuXiaodongSupervisor:FengJunProfessorJune2018摘要摘要药物关系抽取(Drug-DrugInteractionExtraction,DDIE)任务主要研究如何利用自然语言处理技术从生物医学文献中自动抽取出两种药物之间存在的相互作用。DDIE任务的研究对减少药物安全事故、降低
3、医疗成本,具有十分重要的意义。过去解决DDIE任务的主流方法是基于特征及核函数的方法,但是该类方法往往需要手动提取多种复杂的特征,费时费力。随着深度学习技术的发展,一些研究者已经成功地将深度学习技术应用于DDIE任务上,并且取得了比核函数方法更好的结果。本文尝试采用多种深度学习网络解决DDIE问题,最终提出了一种CNN-GRU方法,获得了比该领域现有方法更好的性能。现有DDIE领域的研究中,基于深度学习的方法大部分都是以词向量和距离向量作为输入,这些方法所用的模型大都结构简单,分类能力不足。针对
4、这些问题,本文第二章提出一种改进的多层CNN网络模型。该模型仅采用GloVe词向量作为输入,同时模型中设置了多个卷积层,并分别为每个卷积层设置了池化层,提高了模型的分类能力。本文在DDIExtraction2013竞赛提供的公开数据集上对所提出的模型进行了训练和评估,取得了74.9%的F值,比现有的最好结果提高了2.7%。本文第二章提出的改进的多层CNN网络模型分类能力较好,但无法很好地提取出输入文本中包含的序列信息。针对这一问题,本文第三章在现有的区域化CNN+LSTM模型基础上进行改进,提出
5、一种BNCNN-LSTM模型以更好地解决DDIE任务。该模型结合了区域CNN网络和LSTM网络的优点,既能挖掘出每个区域内的局部特征信息,也能挖掘出区域间包含的序列信息,因此在实验中表现出了比改进的多层CNN网络模型更好的性能(F值为76.4%)。同时,本文在该模型中加入了批量正则化层,有效地加快了模型的训练速度。本文第三章提出的BNCNN-LSTM模型结构较为复杂。为了简化该模型,本文第四章尝试在BNCNN-LSTM模型上进行改进,采用结构更为简单的GRU网络替换LSTM网络,同时去掉模型中的
6、批量正则化层,提出一种CNN-GRU模型。该模型不仅结构更为简单,同时在DDIExtraction2013数据集上展示出了比BNCNN-LSTM模型更好的分类性能。关键词:药物关系抽取,自然语言处理,深度学习,CNN,LSTM,GRUIABSTRACTABSTRACTDrug-DrugInteractionExtraction(DDIE)taskfocusesonhowtousenaturallanguageprocessingmethodstoautomaticallyextractthein
7、teractioninformationbetweentwodrugsfromthebiomedicalliterature.Thestudyofthistaskisofgreatsignificanceforreducingaccidentscausedbyadversedrugreactionsandreducingmedicalcosts.ThemainwaytosolveDDIEtaskinthepastisfeatureandkernelfunctionbasedrelationext
8、ractionapproach.However,thistypeofmethodoftenrequirescomplicatedfeatureengineering,whichistime-consumingandlaborious.Withthedevelopmentofdeeplearningneuralnetworks,someresearchershavesuccessfullyapplieddeeplearningtechnologytoDDIEtaskandachievedbette
此文档下载收益归作者所有