欢迎来到天天文库
浏览记录
ID:35067207
大小:3.26 MB
页数:58页
时间:2019-03-17
《基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发RESEARCHANDPLATFORMDEVELOPMENTONCHINESEELECTRONICMEDICALRECORDSENTITYASSERTIONANDRELATIONEXTRACTIONBASEDONDEEPLEARNING杨晨浩哈尔滨工业大学2016年6月国内图书分类号:TP391.1学校代码:10213国际图书分类号:638.1密级:公开硕士学位论文基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发硕士研究生:杨晨浩导师:关毅教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技
2、术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学-I-ClassifiedIndex:TP391.1U.D.C:638.1DissertationfortheMasterDegreeRESEARCHANDPLATFORMDEVELOPMENTONCHINESEELECTRONICMEDICALRECORDSENTITYASSERTIONANDRELATIONEXTRACTIONBASEDONDEEPLEARNINGCandidate:YangChenhaoSupervisor:Prof.GuanYiAcademicDegreeAppliedfor:MasterofEnginee
3、ringSpeciality:ComputerTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology-II-哈尔滨工业大学工程硕士学位论文摘要随着人们生活质量的提高和经济水平的发展,医疗健康问题被社会各界广泛关注。而在如今电子化医疗系统迅速普及的现状下,大量医疗相关的信息以电子病例的形式存储下来,经过不断积累,已具备了一定的规模。传统的自然语言处理技术大多需要人工标注这
4、些数据,导致大多未标注的原始病例数据无法有效的应用到任务处理中去。利用深度学习算法特征自学习的特点则可以很好地无监督地训练未标注数据,得到自适应的特征用于下一步处理中去。在本文中,针对于中文电子病历的特点,开发了一个自动化的、可扩展的、高度模块化的深度学习算法平台,集成深度学习领域目前较为热门的循环神经网络、递归张量神经网络等模型,用于处理中文电子病历中的常用任务。该平台可以快捷地利用深度学习算法对中文电子病历中的信息抽取任务进行实验,简化了实验中的大量重复工作步骤,达到了快速调试并得出结果的目的。在深度学习平台功能开发的基础上,本文也利用平台对中文电子病历实体关系抽取做出了研究和实验,
5、得出了一定的实验结果。实体关系抽取基于递归张量神经网络(RNTN),在构建好的句法树上递归训练词向量,并自顶向下训练多分类器达到关系分类的目的。在深层网络训练内部特征的基础上加入了具有中文电子病历特点的外部特征,并做了对比实验和结果分析。本文利用平台对中文电子病历实体修饰识别做出了研究和实验。实体修饰识别基于循环神经网络(RNN),主要以实体周围的语义信息为特征训练实体修饰的分类。在深层网络训练内部特征的基础上也加入了外部特征予以约束,并做了对比实验和结果分析。关键词:中文电子病历;深度学习;平台开发;关系抽取;实体修饰;-III-哈尔滨工业大学工程硕士学位论文AbstractWitht
6、heimprovementofpeople'slifequalityandthedevelopmentofeconomiclevel,medicalandhealthproblemshavebeenwidelyconcernedbythesociety.Andasnowadayselectronicmedicalsystemrapidlygrowspopular,alargenumberofmedicalrelateddatawasstoredbyEMR.Throughcontinuousaccumulation,variousformsofelectronicmedicalsystem
7、producedhugemedicaldata.TheChineseEMRdatahashadapreliminaryscale.Traditionalnaturallanguageprocessingtechnologymostlyrequiremanualannotationofthesedata,whichleadstheoriginaldatathatunlabeledcannotbeeffectivelyappliedto
此文档下载收益归作者所有