中文电子病历实体关系抽取研究

中文电子病历实体关系抽取研究

ID:35039285

大小:1.69 MB

页数:56页

时间:2019-03-16

中文电子病历实体关系抽取研究_第1页
中文电子病历实体关系抽取研究_第2页
中文电子病历实体关系抽取研究_第3页
中文电子病历实体关系抽取研究_第4页
中文电子病历实体关系抽取研究_第5页
资源描述:

《中文电子病历实体关系抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:391.1学校代码:10213国际图书分类号:638.1密级:公开工学硕士学位论文中文电子病历实体关系抽取研究硕士研究生:程健一导师:关毅教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.1U.D.C:638.1DissertationfortheMasterDegreeinEngineeringRESEARCHONRELATIONEXTRACTIONFORCHINESEELECTRONICMEDICALRECORDSCand

2、idate:ChengJianyiSupervisor:Prof.GuanYiAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要随着医疗健康服务不断向信息化、智

3、能化发展,电子病历开始逐渐在医疗健康事业中发挥作用。电子病历对个人的诊疗过程有比较详细的记录,包含大量的医疗知识,有效地挖掘并利用这些知识对于医疗健康事业的发展有重要作用,挖掘电子病历中知识的主要途径就是信息抽取相关的技术,其中关系抽取是电子病历信息抽取中的重要部分。本文研究主要研究中文电子病历的关系抽取方法,在中文电子病历中除了大量医疗相关的知识外,还包括与患者、医生等相关的隐私信息,为了保护这些隐私信息,需要在对电子病历进行关系抽取前对其完成去隐私,即找到电子病历中的隐私信息并将其替换。制定了隐私信息标注规范并标注了100份电子病历,使用条件随机场(CRF

4、)完成了隐私信息识别模型的构建,识别的F值达到96.9%。在关系抽取方面,本文使用了992份经去隐私的已标注中文电子病历,首先实现了基于特征的关系抽取方法,通过抽取一些基本特征以及中文电子病历中一些特有的特征,训练支持向量机(SVM)单分类器并分析了实验结果。然后针对单分类器中关系大类的误分类情况,将单分类器分解为多个分类器用于处理指定关系大类下的样本,改进后的方法关系识别的F值达到73.4%同时减少了训练及测试的时间消耗。中文电子病历的文本具有结构相似的特点,从此角度出发使用基于树核函数的方法对中文电子病历进行关系抽取的探索,将样本表示为句法分析树并由计算两

5、棵树中相同子集树的数量的方式得到样本间相似度,利用这样的子集树核函数训练SVM多分类器,最终对关系识别的F值达到61.4%。中文电子病历的文本特征与结构相似性对关系抽取都有重要作用,本文在扩展基于特征的方法与基于树核函数的方法的特征空间的基础上,对两个方法相应的核函数进行了结合,得到特征与树核函数结合的方法,并使用组合后的方法完成了关系抽取,通过改变两种方法的权重调整模型的效果以及对比实验结果可以看出,特征与树核函数结合的方法关系识别效果最佳,F值达到75.9%,但仍有部分实体关系的识别效果还比较低,有待进一步改善。关键词:中文电子病历;关系抽取;支持向量机;

6、树核函数-I-哈尔滨工业大学工学硕士学位论文AbstractMedicalandhealthservicesaregraduallydevelopingtowardsinformationandintelligence,electronicmedicalrecords(EMRs)starttoplayanimportantroleinhealthcareindustry.EMRscontaindetailedrecordsofindividualtreatmentprogressandahugequantityofmedicalknowledge,itisim

7、portanttoextractandusethisknowledgeeffectively,themainapproachtoEMRsknowledgeminingisinformationextractioninwhichrelationextractionofEMRsplayanimportantrole.ThispapermainlyfocusonresearchofrelationextractioninChineseelectronicmedicalrecords(CEMRs).Exceptforthehugequantityofmedicalkn

8、owledge,CEMRsalsoco

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。