基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发

基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发

ID:35067207

大小:3.26 MB

页数:58页

时间:2019-03-17

基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发_第1页
基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发_第2页
基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发_第3页
基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发_第4页
基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发_第5页
资源描述:

《基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发RESEARCHANDPLATFORMDEVELOPMENTONCHINESEELECTRONICMEDICALRECORDSENTITYASSERTIONANDRELATIONEXTRACTIONBASEDONDEEPLEARNING杨晨浩哈尔滨工业大学2016年6月国内图书分类号:TP391.1学校代码:10213国际图书分类号:638.1密级:公开硕士学位论文基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发硕士研究生:杨晨浩导师:关毅教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技

2、术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学-I-ClassifiedIndex:TP391.1U.D.C:638.1DissertationfortheMasterDegreeRESEARCHANDPLATFORMDEVELOPMENTONCHINESEELECTRONICMEDICALRECORDSENTITYASSERTIONANDRELATIONEXTRACTIONBASEDONDEEPLEARNINGCandidate:YangChenhaoSupervisor:Prof.GuanYiAcademicDegreeAppliedfor:MasterofEnginee

3、ringSpeciality:ComputerTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology-II-哈尔滨工业大学工程硕士学位论文摘要随着人们生活质量的提高和经济水平的发展,医疗健康问题被社会各界广泛关注。而在如今电子化医疗系统迅速普及的现状下,大量医疗相关的信息以电子病例的形式存储下来,经过不断积累,已具备了一定的规模。传统的自然语言处理技术大多需要人工标注这

4、些数据,导致大多未标注的原始病例数据无法有效的应用到任务处理中去。利用深度学习算法特征自学习的特点则可以很好地无监督地训练未标注数据,得到自适应的特征用于下一步处理中去。在本文中,针对于中文电子病历的特点,开发了一个自动化的、可扩展的、高度模块化的深度学习算法平台,集成深度学习领域目前较为热门的循环神经网络、递归张量神经网络等模型,用于处理中文电子病历中的常用任务。该平台可以快捷地利用深度学习算法对中文电子病历中的信息抽取任务进行实验,简化了实验中的大量重复工作步骤,达到了快速调试并得出结果的目的。在深度学习平台功能开发的基础上,本文也利用平台对中文电子病历实体关系抽取做出了研究和实验,

5、得出了一定的实验结果。实体关系抽取基于递归张量神经网络(RNTN),在构建好的句法树上递归训练词向量,并自顶向下训练多分类器达到关系分类的目的。在深层网络训练内部特征的基础上加入了具有中文电子病历特点的外部特征,并做了对比实验和结果分析。本文利用平台对中文电子病历实体修饰识别做出了研究和实验。实体修饰识别基于循环神经网络(RNN),主要以实体周围的语义信息为特征训练实体修饰的分类。在深层网络训练内部特征的基础上也加入了外部特征予以约束,并做了对比实验和结果分析。关键词:中文电子病历;深度学习;平台开发;关系抽取;实体修饰;-III-哈尔滨工业大学工程硕士学位论文AbstractWitht

6、heimprovementofpeople'slifequalityandthedevelopmentofeconomiclevel,medicalandhealthproblemshavebeenwidelyconcernedbythesociety.Andasnowadayselectronicmedicalsystemrapidlygrowspopular,alargenumberofmedicalrelateddatawasstoredbyEMR.Throughcontinuousaccumulation,variousformsofelectronicmedicalsystem

7、producedhugemedicaldata.TheChineseEMRdatahashadapreliminaryscale.Traditionalnaturallanguageprocessingtechnologymostlyrequiremanualannotationofthesedata,whichleadstheoriginaldatathatunlabeledcannotbeeffectivelyappliedto

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。