基于自然语言处理技术的循证医学信息提取研究

基于自然语言处理技术的循证医学信息提取研究

ID:14726867

大小:14.49 MB

页数:77页

时间:2018-07-30

基于自然语言处理技术的循证医学信息提取研究_第1页
基于自然语言处理技术的循证医学信息提取研究_第2页
基于自然语言处理技术的循证医学信息提取研究_第3页
基于自然语言处理技术的循证医学信息提取研究_第4页
基于自然语言处理技术的循证医学信息提取研究_第5页
资源描述:

《基于自然语言处理技术的循证医学信息提取研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、复旦大学博士学位论文基于自然语言处理技术的循证医学信息提取研究姓名:卢延鑫申请学位级别:博士专业:医学信息学指导教师:周国民20110402 复旦大学博士学位论文人工注解的结果进行对比,评估显示基于机器学习文本分类器提取致病因素相关分别为�.�ズ���%。结论:本研究开发出两个系统从生物医学文献中自动提取致病因素和疾病相 复旦大学博士学位论文关词项,分别是基于规则的文本分类器和基于机器学习的文本分类器。评估结果证实基于机器学习的文本分类器优于基于规则的分类系统。该方法对于从流行病学研究文献中自动提取

2、循证医学研究的证据有很大的帮助。 复旦大学博士学位论文�������������������:����������������������,������������������������.������������������.����������������瑆�����������������������.������������������������������������������猺������������.����������������,��琣�����������篢���������

3、������.��������� 复旦大学博士学位论文�����.���������������������.�����,�����������������������甌����������������������琣�����������������������������������������甌���������������������篘���������������籌������������;�����������;����������;�����;����� 复旦大学博士学位论文缩略语���

4、����������������������������������������������������������������������支持向量机真实肯定预测文本检索会议统一医学语言系统向量空间模型多义词歧义消解��������������������������� 复旦大学博士学位论文多的生物医学文献发表出来。美国国立医学图书馆����������,简称��建立了当前国际上最权威的生物医学文献数据库:美国医������,简称����。该数据库收录了自��年以来世界�多个国家和地区出版的数千种生

5、物医学期刊中的文献,并且每年都在以�.�万条记录的速流行病学是预防医学中的主导学科,也是医学各领域的一门重要基础学科。 复旦大学博士学位论文较低的准确率�∮���。尽管通过信息技术处理流行病文献,提取相关信息对于公共卫生研究具有重要性,但是目前仍然缺乏这方面的研究。大多数之前的研究都是提取生物医学文本中的所有术语,但是本课题的研究目标是提取一组信息:流行病研究中的致病因素和疾病的信息。因此,我们需要对大量的文本信息进行过滤,这一工作具有很大的挑战性。 ����������②基于规则的分类器:③基于机

6、器学习的分类器。�����������; 复旦大学博士学位论文课题随机从中选取两组数据:①训练数据;②测试数据。依据本研究制定的注��文本中提取信息。它可以帮助研究者从生物医学领域的文献中找到感兴趣的知识,并且确定这些信息在����������的具体概念。����分类器将一组启发式的规则分派到各个名词词组。从��概念。 复旦大学博士学位论文���惴ǎ虎燮铀乇匆端�������算法;④支持向量�������算法。第二章介绍了循证医学的历史、发展与其在临床实践中的作用,指出了循证第五章主要介绍了基于规则

7、的文本自动分类系统��,它由两部分组成,第一部分是一个自然语言处理引擎��,它能够将生物医学文本信息中的名词短语自动提取出来,并获得该名词短语及其邻近短语的语义等特征信息。第二部分是一个基于规则的文本分类器,它能够按照预先设计好的规则给每一个名词短语打分,再根据我们设定好的标准来提取出致病因素相关的信息。通过对比流行 复旦大学博士学位论文于四种机器学习方法的文本分类器,分别是:朴素贝叶斯算法���本文的创新之处主要有以下几个方面:此部分研究成果发表在医学信息学专业国际顶级学术会议期刊上。���算法。

8、评估证实朴素贝叶斯算法有着最好的的覆盖面较好,但是更适合流行病学研究的标准词汇还是迫切需要的。 复旦大学博士学位论文第二章循证医学研究��概述思想是:任何医疗决策的确定都应基于客观的临床科学研究依据;任何临床的诊治决策,必须建立在当前最好的研究证据与临床专业知识和患者的价值相结合的关键。本章将介绍循证医学的形成与发展,它的应用及发展瓶颈。���教授将循证医学定义为“慎重、准确和明智地应用当前所能获得的最佳研究依据,同时结合医生的个人专业技能和多年临床经验,考虑病人的价

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。