欢迎来到天天文库
浏览记录
ID:35059671
大小:2.73 MB
页数:57页
时间:2019-03-17
《基于中文电子病历的跨科室组块分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于中文电子病历的跨科室组块分析研究RESEARCHONCROSS-DEPARTMENTCHUNKINGBASEDONCHINESEELECTRONICMEDICALRECORD戴雪哈尔滨工业大学2016年6月国内图书分类号:TP391.1学校代码:10213国际图书分类号:638.1密级:公开工学硕士学位论文基于中文电子病历的跨科室组块分析研究硕士研究生:戴雪导师:关毅教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP
2、391.1U.D.C:638.1DissertationfortheMasterDegreeinEngineeringRESEARCHONCHUNKINGBASEDONCROSS-DEPARTMENTCHINESEELECTRONICMEDICALRECORDCandidate:DaiXueSupervisor:Prof.GuanYiAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofCom
3、puterScienceandTechnologyDateofDefence:June,2016sDegree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要21世纪,“互联网+”已经成为社会的热点话题,而“互联网+医疗”正是政府积极推广的新型在线医疗卫生模式,其中包含了构建电子病历等重要举措,大量的医疗信息数据随之产生。电子病历正是最重要的信息之一,它包含患者丰富的个人医疗信息,利用自然语言处理技术,充分学习其中的健康知识将会促进智慧医疗的长远发展。针对
4、研究课题,本文进行了以下的研究:(1)参照PCTB语料标注规范,修改适用于中文电子病历的组块语料标注规则并构建组块分析标注语料。本文参照PCTB的语料标注规范,针对中文电子病历的特点,提出适用的修改及补充规范。在实验室前期构建的基础上,采用自动化识别加人工校对的方式获得了306份的包含分词、词性、组块标注的中文电子病历,语料库标注一致性达到98%。(2)开展基于SCL算法的中文电子病历跨科室组块分析研究。本文在SCL算法的基础上,对生成的相关性变量进行离散化,改进的算法提升了实验效果,在词性和组块分析任务中,F值都有约1%的改进。(3)开展基
5、于TrAdaBoost算法的中文电子病历跨科室组块分析研究。本文在TrAdaBoost算法的基础上,进行多分类任务的算法适用,提出了辅助预料选择算法,利用主动学习的方法筛选目标科室的辅助标注语料,三组交叉验证实验中,TrAdaBoost算法的F值平均提升了5%以上,而辅助选择算法在此基础上平均提升了约0.6%。(4)结合上述两种算法进行双重迁移学习,同时基于特征和实例对数据进行知识迁移,并引入辅助选择算法,最后的实验结果较Baseline的结果仍然有着显著的提升,具有一定的实用性。综上所述,本文在中文电子病历上构建了组块分析语料,利用两种不同
6、的迁移学习算法进行跨科室组块分析,对两种算法都提出了改进方法并获得了实验的有效验证,最后,结合两种方法进行双重迁移并证明算法具有可用性。关键词:中文电子病历;语料构建;组块分析;迁移学习-I-哈尔滨工业大学工学硕士学位论文ABSTRACTIn21stcentury,"Internet+"hasbecomeahottopicinsociety,andthe"Internet+Health"isthegovernmentactivelypromotethenewonlinehealthcaremodel,whichincludesimportan
7、tinitiativestobuildelectronicmedicalrecords,alargenumberofmedicalinformationdataconsequent.Itisoneofthemostimportantinformationandelectronicmedicalrecords(CEMRs)thatitcontainsawealthofpersonalmedicalinformationofpatients,fullylearningthehealthknowledgeofCEMRswiththehelpofna
8、turallanguageprocessingtechnologywillpromotelong-termdevelopmentofwisdommedical.Ai
此文档下载收益归作者所有