数据融合在电子病历检索中的应用研究

数据融合在电子病历检索中的应用研究

ID:35178983

大小:3.60 MB

页数:66页

时间:2019-03-20

数据融合在电子病历检索中的应用研究_第1页
数据融合在电子病历检索中的应用研究_第2页
数据融合在电子病历检索中的应用研究_第3页
数据融合在电子病历检索中的应用研究_第4页
数据融合在电子病历检索中的应用研究_第5页
资源描述:

《数据融合在电子病历检索中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391.3密级:公开UDC:004.738.52编号:10299S1308051硕士学位论文数据融合在电子病历检索中的应用研究ResearchonApplicationofDataFusionMethodsinElectronicMedicalRecordRetrieval指导教师吴胜利教授作者姓名周新科申请学位级别硕士专业名称计算机应用技术论文提交日期2016年4月论文答辩日期2016年6月学位授予单位和日期江苏大学2016年6月答辩委员会主席张建明评阅人__________学位论文版权使用授权书江苏大

2、学、中国科学技术信息研究所、国家图书馆、中国学术期刊(光盘版)电子杂志社有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致,允许论文被查阅和借阅,同时授权中国科学技术信息研究所将本论文编入《中国学位论文全文数据库》并向社会提供查询,授权中国学术期刊(光盘版)电子杂志社将本论文编入《中国优秀博硕士学位论文全文数据库》并向社会提供查询。论文的公布(包括刊登)授权江苏大学研究生院办理。本学位论文属于不保密□。学位论文作者签名:指导教师签名:年月日

3、年月日独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日江苏大学硕士学位论文摘要近年来随着医疗办公无纸化的推广,电子病历(ElectronicMedicalRecord,EMR)的使用也越来越普及。电子病历中不但记录病人病情,还记录了医生对病人的治疗方案以

4、及治疗效果。当医生在临床诊断的时候可以利用这些信息来进行辅助决策。然而面对日益增长的电子病历数据,如何能够快速地在海量的电子病历中找到需要的信息是当前的一个挑战。现在的电子病历检索系统存在着一定的缺陷,特别是针对电子病历中半结构化的部分,还不能做到有效的识别和检索,而医疗领域又是一个对信息准确度有着高要求的领域,因此如何提高电子病历的检索性能就显得尤为重要。另一方面,信息检索中的数据融合技术能够将多个检索系统的结果通过一定的方法重新组合成一个新的结果。以往的研究表明,使用数据融合方法能够提升最终检索结果性能,而在电子

5、病例检索领域中,并未对数据融合方法的应用进行深入的探索。因此,对于电子病历的检索,本文考虑从数据融合的角度出发,来对其进行研究。论文主要工作如下:(1)对已有的数据融合算法进行分析,探索其在电子病历检索中的适用性。首先分析了两种经典的数据融合算法CombSUM和CombMNZ,这两种算法同等对待所有的检索系统和结果。但在数据融合中,参与融合的系统性能可能各不相同,如果不加区分,同等对待所有的系统不能取得较好的结果。因此本文重点考虑了数据融合中一类算法——线性组合法。该类算法能够根据具体的情况对参与融合的成员系统赋予不

6、同的权重,比较灵活。对成员系统进行合适的权重分配是决定线性组合法成功与否的关键。特别地,本文分析了基于多元线性回归的权重分配策略和基于遗传算法的权重分配策略。选择前者,主要是利用最小二乘法可以很准确地估计文档的相关性得分从而提高电子病历检索的最终融合效果;选择后者,则是希望利用遗传算法良好的全局探索能力,以便获取到一组能够提升最终融合效果的系统权重。除此之外,本文中首次将粒子群算法引入到数据融合中,利用粒子群算法中粒子之间能够相互通信、逐渐趋向于最优解的特点,优化权重分配策略,提高融合结果的性能。最后将这五种数据融合

7、算法应用到电子病历检索中。I江苏大学硕士学位论文(2)实验采用权威性的TREC检索评价会议中的两项有关的数据集。在参与融合的成员系统个数不同的情况下,测试了五种融合算法结果在多种评价指标下的有效性,同时也比较了它们所消耗的时间。实验结果表明,使用基于粒子群算法的权重分配策略对电子病历检索的融合效果提升最好;在同等情况下,五种融合算法中CombSUM消耗的时间最少;而如果兼顾考虑融合的时间和效果的话,基于多元线性回归的权重分配策略是一个不错的选择。最后,本文的实验结果表明,使用数据融合算法来提升电子病历检索的性能是可行

8、的。关键词:电子病历检索,数据融合,线性组合法,遗传算法,权重分配,粒子群算法II江苏大学硕士学位论文ABSTRACTInrecentyears,withtheprevalenceofpaperlessofficemedical,electronicmedicalrecords(EMR)isbecomingmoreandmorepopular.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。