欢迎来到天天文库
浏览记录
ID:37045796
大小:2.69 MB
页数:58页
时间:2019-05-15
《面向医疗领域的命名实体识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文面向医疗领域的命名实体识别栗冬冬哈尔滨理工大学2018年6月国内图书分类号:TP391.1工程硕士学位论文面向医疗领域的命名实体识别硕士研究生:栗冬冬导师:刘宇鹏申请学位级别:工程硕士学科、专业:计算机技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391.1DissertationfortheMasterDegreeinEngineeringNamedEntityRecognitioninMedicalFieldCandidate:LiDongd
2、ongSupervisor:LiuYupengAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerAppliedTechnologyDateofOralExamination:June,2018University:HarbinUniversityofScienceandTechnology哈尔滨理工大学工程硕士学位论文面向医疗领域的命名实体识别摘要随着电子信息技术的发展,电子病历在各大医院的应用越来越普及,不同于传统的纸质病历,电子病历便于储存和管理。病历一般存储着病患的疾病症状、诊
3、断经过等与临床治疗相关的重要信息,它与病患的健康有着紧密的联系,因此对电子病历的数据挖掘和分析在近年来受到了广泛的关注,而命名实体识别的研究作为自然语言处理的一个重要的基础任务,有着重要的意义。深度学习近年来在发展迅速且应用广泛,循环神经网络(RecurrentNeuralNetwork,RNN),尤其长短期记忆网络(Long-ShortTermMemory,LSTM)在自然语言处理的各个领域都取得了非常好的成绩。卷积神经网络(ConvolutionalNeuralNetwork,CNN)在提取词语字符级别特征方面变现优异。本文首先利用LSTM对医疗领域命
4、名实体识别任务进行建模,对模型结构进行了详细介绍,并在模型中加入字向量,实验表明加入字向量可以提高模型性能。紧接着介绍了如何利用CNN提取出词语基于字符的表示信息,并将其输入到LSTM模型当中,在实验部分对比分析了对数据采用词语标注和字符标注的实验效果。最后,把条件随机场(ConditionalRandomFields,CRF)和双向长短期记忆网络(Bi-directionalLong-ShortTermMemory,BLSTM)、卷积神经网络结合到一起,构建基于BLSTM-CNN-CRF的命名实体识别模型,实现了端对端的预测,不需要任何的手工选取特征和预
5、处理数据,因此它的适用性十分广泛,可以应用于各种领域的实体识别任务。在实验部分做了多组对比实验,BLSTM-CNN-CRF模型在测试集上的F1值达到了90.97%,相比BLSTM、BLSTM-CNN模型分别提高了1.64%和1.29%。关键词命名实体识别;条件随机场;长短期记忆网络;医学领域-I-哈尔滨理工大学工程硕士学位论文NamedentityrecognitioninmedicalfieldAbstractWiththedevelopmentofelectronicinformationtechnology,electronicmedicalreco
6、rdsaremoreandmorepopularinmanyhospitals.Differentfromthetraditionalpapermedicalrecords,electronicmedicalrecordsareeasierforstoragemanagement.Electronicmedicalrecordsgenerallystoremanyimportantinformationofpatientswithsymptomsofthedisease,clinicaldiagnosisandtreatment.Ithasacloseco
7、nnectionwithpatients’health.Sotheminingandanalysisoftheelectronicmedicaldatahasreceivedextensiveattentioninrecentyears.AndtheentityrecognitionregardedasanimportantbasictaskofNaturalLanguageProcessingisofgreatsignificance.Deeplearninghasbeendevelopingrapidlyandpopularizedinrecentye
8、ars.Recurrentneuralnetwork(RNN),e
此文档下载收益归作者所有