基于有监督学习的医疗实体抽取方法研究

基于有监督学习的医疗实体抽取方法研究

ID:35181184

大小:3.38 MB

页数:54页

时间:2019-03-21

基于有监督学习的医疗实体抽取方法研究_第1页
基于有监督学习的医疗实体抽取方法研究_第2页
基于有监督学习的医疗实体抽取方法研究_第3页
基于有监督学习的医疗实体抽取方法研究_第4页
基于有监督学习的医疗实体抽取方法研究_第5页
资源描述:

《基于有监督学习的医疗实体抽取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、^'’^-''^■''粹?■V"'^^'■-■'.VrV,^A:;^Ac、塑!0:一^邏巡)?!!■;別._教山咕/fe.、,公鐵置貫、f-y10488'聲今八子,公一琪黃校代码-、篇;密级—一记..''、'"-’--:....、.;;;5等^>、.■—冷、。.'-,.、知'''一专-一於一尸..巧職哈.,成\;?.冻為-——'-■■-:v-V這己^y、.—::皆心V。,纖\游r占<'、嘴事"‘.."''''...’'',.,''成主八--;穿^

2、-;-封\,.人3-心黎满读.',',巧、州.、.■'? ̄-’-.、、-'擎;:‘W'-片,七、卢,-,>气,.',:-兴’、、^,/.,...丈?詳X咕這皆^在iiiif敏儀抑穀夫冷誦薦i--I::一:‘-八.,'-r号軒二去枉是皂a户''皆''’…-.'’-.'-'-記,-"h,苗,—V一,说告]U:;作;v;爸古辣'//,'*:皆—知、為;皆?兴聲皆,>裘駐_鄉茫晏'古学位论文滿■满1編?t"霉,硕?'—一.斬'屬六:巧,胜::嘗.如聲V.

3、於、-.':^苗巧达产:-i每心、:'S于有监督学习前壓巧实体抽取方法SlS'冷4至若;气-'—.又挪巧—在知^常逛京一诉lR姜捏一诚-"-,&!:.—-義’‘^籌皆V:如接然.;、;聲,;。:.‘、.'?'’■…..'、'^’‘::.'';;巧诗户古、;.;5? ̄;;WC^‘.-、-古、、巧考^i^姑其知一^:^,:^.''.-■’公:礙絲心批记户东V,'.;-',巧维.人'-饒\r去六托乃按,^龙-。、:子'文末'j一.心-A;■'呼卢学化申请入;.斧华Jy'良一;

4、巧兴。;^:-一'去工.:程诗三詳%妒早学科专业软件1.'.’.'-;.二.-V以巧气六;:游编——指导教师:刘茂福古結—-三?作,.^.?一''’^.''/V、'.'苗贿t立3^/:V琼’、。日期;JV;:2〇16年5月21日皆r式V麻:.-;导歡蘇.、';.-—.节’.-’-心-三-.'淨、''.卢—^-?-i■^三苗'、:襄苗孩';N古':>'-^、:孩沪義其'‘11{苗>.'.、名.養---、--.心.:溝-.绰細^;令:續事葬苗'覆三V

5、解务立韓鐵苗‘;诚錐;x.一寫類辦霄、自巧簿誘挙ADissertationSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterinEngineeringResearchonMedicalEntityExtractionBasedonSupervisedLearningMasterCandidate:HuaXuMajor:SoftwareEngineeringSupervisor:Prof.MaofuLiuWuhanUniversityofScie

6、nceandTechnologyWuhan,Hubei430081,P.R.ChinastMay21,2016摘要实体抽取是识别文本中具有特定意义的实体,是将文本结构化的基础,作为快速获取重要信息的自动化工具被应用于多个领域,其在自然语言处理领域中已经相当成熟,随着电子医疗文本急剧增加,医疗实体抽取在医疗领域的应用越来越受到关注。然而,针对医疗领域的专业术语,通用实体抽取方法普遍存在准确率不高的问题。本文在基于术语表抽取医疗实体的基础上,研究了如何提高医疗实体抽取准确率的方法,主要是从术语表和规则相结合的方法到监督学习方法。本文

7、重点分析了机器学习模型的选择和特征集的选取,从而达到更高效抽取医疗实体的目的。本文主要使用了基于术语表和规则匹配、支持向量机和条件随机场一系列进行医疗实体抽取的方法。在实体识别阶段,通过比较现有的识别方法和模型,采用了“术语表和规则相结合”进行实验对比;进而采用监督学习方法,对医疗文本提取特征,构建特征模板,分别基于SVM模型和CRF模型对医疗实体进行抽取,再次进行实验对比。实验结果采用准确率、召回率、F值和正确率四种标准进行评估,实验结果表明,基于条件随机场的医疗实体抽取方法的结果较为理想。关键词:实体抽取;医疗领域;条件随机

8、场;支持向量机;语言规则IAbstractTheentityextractionistorecognizeentitiesthathavespecialmeaninginthetext,andthebasisofstructuringthetext.Entity

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。