基于条件随机场的中医临床病历命名实体抽取.pdf

基于条件随机场的中医临床病历命名实体抽取.pdf

ID:53575676

大小:358.24 KB

页数:5页

时间:2020-04-19

基于条件随机场的中医临床病历命名实体抽取.pdf_第1页
基于条件随机场的中医临床病历命名实体抽取.pdf_第2页
基于条件随机场的中医临床病历命名实体抽取.pdf_第3页
基于条件随机场的中医临床病历命名实体抽取.pdf_第4页
基于条件随机场的中医临床病历命名实体抽取.pdf_第5页
资源描述:

《基于条件随机场的中医临床病历命名实体抽取.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第40卷第9期计算机工程2014年9月Vo1.40No.9ComputerEngineeringSeptember2014·开发研究与工程应用·文章编号:1000.3428(2014)09-0312-05文献标识码:A中图分类号:TP391基于条件随机场的中医临床病历命名实体抽取刘凯h,周雪忠h’,于剑h,,张润顺(1.北京交通大学a.计算机与信息技术学院;b.交通数据分析与挖掘北京市重点实验室,北京100044;2.中国中医科学院广安门医院,北京100053)摘要:中医临床病历是中医重要的科研数据资源,但目前临床病历仍以文本为主要表达形式,对病历数据深入分析的前提是进

2、行结构化信息抽取,而命名实体抽取是其基础性步骤。针对中医临床病历的命名实体,如症状、疾病和诱因等的抽取问题,通过手工标注的413份病历数据(以中文字为特征)与4类特征模版,将条件随机场(CRF)、隐马尔科夫模型(HMM)和最大熵马尔科夫模型(MEMM)用于中医病历命名实体抽取的实验,并进行比较分析。结果表明,结合合适的特征模版,CRF命名实体抽取方法取得了较好的性能,F1值的症状达到O.8O,疾病名称达到0.74,诱因0.74。与HMM和MEMM相比,CRF有最高的准确率和召回率,是一种较为适用的中医临床病历命名实体抽取方法。关键词:中医临床病历;命名实体抽取;语料库标

3、注系统;条件随机场;特征模板NamedEntityExtractionofTraditionalChineseMedicineMedicalRecordsBasedonConditionalRandomFieldLIUKai,ZHOUXue.zhong,YUJian。,¨ZHANGRun.shun,(1a.SchoolofComputerandInformationTechnology;1b.BeijingKeyLabofTrafficDataAnalysisandMining,BeijingJiaotongUniversity,Beijing100044,China;

4、2.Guang’anmenHospital,ChinaAcademyofChineseMedicalSciences,Beijing100053,China)【Abstract】TraditionalChineseMedicine(TcM)medicalrecordsaretheimportantdataresourcesoftheTcMmedicalresearch.Themainformofthemisstilltextnow,anditisnecessarytoextractthestructuredinformationfromthemedicalrecords

5、,whilenamedentityextractionisthebasicstep.Itmakes413copiesofmanuallylabeledmedicalrecordsinChinesetextandfourtypesoffeaturetemplatestostudyaboutthenamedentityextractionpracticesuchassymptoms,diseasesandincentives.ItcomparestheresultsofTCMmedicalrecordsnamedentityextractionbyConditionalRa

6、ndomField(CRF),HiddenMarkovModel(HMM)andMaximumEntropyMarkovModel(MEMM).Combinedwithappropriatefeaturetemplates,CRFhaswellperformanceofF1:symptoms0.80,thenameofthedisease0.74,incentives0.74.ComparedwithHMMandMEMM,CRFhasthehighestprecisionandrecallrate.ThispreliminaryshowsthatCRFisanappli

7、cablemethodoftheChinesemedicalrecordsnamedentityextraction.【Keywords】TraditionalChineseMedicine(TcM)medicalrecords;namedentityextraction;corpusannotationsystem;Conditiona1RandomField(CRF):featuretemplateDoI:10.3969/j.issn.1000.3428.2014.09.062体术语的抽取,而命名实体抽取方法正是从自由文1概述本中抽取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。