欢迎来到天天文库
浏览记录
ID:37618072
大小:442.16 KB
页数:7页
时间:2019-05-26
《生物医学文献中的隐含知识发现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、生物医学文献中的隐含知识发现,杨志豪林鸿飞(大连理工大学计算机科学与工程系大连116024)E-mail:yangzzhih@O,I,,cn摘要当前出版的医学信息呈指数级增长,给在生物医学文献中应用文本挖掘技术进行隐含医学知识发现提供了前所未有的机会.本文对隐含医学知识发现的研究内容、研究成果进行了阐述,并设计和实现了一个生物医学领域的隐含知识发现系统。该系统对医学文献记录中的医学主题词McSH及自由文本中的医学概念同时进行相关概念提取,弥补了只使用其中一个的不足,提高了获取相关概念的效果.同时基于INLSKnowledgeSources,进行基于概念的查询扩展,提高了相关记录的召回率
2、。并通过语义过滤,降低了搜索空间.关键词文本挖掘,隐含知识发现,自然语言处理HiddenKnowledgeDiscoveryinBiomedicalLiteratureYANGZhihaoandLINHongfei(DepartmentofComputerScienceandEngineering,DalianUniversityofTechnology,Dalian116024)E-mail:vaangzhih@dl.cnAbstract:Biomedicalknowledgeisgrowingatanastoundingpaceandthesevastcollectionsofpu
3、blicationsoferanexcellentopportunityforthediscoveryofhiddenbiomedicalknowledge妙applyingtext-miningtechnologies.Thispaperdescribesthecontentanddevelopmentintheresearchofthehiddenknowledgediscoveryinbiomedicalliteratureandimplementsabiomedicalhiddenknowledgediscoverysystem.Thesystemextractsrelativ
4、ebiomedicalconceptsfrombothMcSHandfreetextintheliteratureandachievesbetterextractingefectcomparingtousingonlyextractingfromoneofthem.Inaddition,byviaofUMLSbiomedicalresources,thissystemperformsaqueryexpansionand,therefore,improvestherecallratioofrelativerecords.Thesystemalsoreducesresearchspaceg
5、reatlythroughasemanticfilter.Keywords:TextMining,HiddenKnowledgeDiscovery,NaturalLanguageProcess.1前言“基于文献的隐含知识发现”是以揭示蕴含于公开发表的文献,但尚未被人们认识或发觉的知识片段间的逻辑联系,从而提出知识假设,以便专业研究人员进一步证实,促使新知识的产生为目的情报研究.其中,对生物医学文献进行隐含知识发现是当今研究的一个热点.作为开创者之一的DonR.Swanson教授于1986年首次在医学文献研究中发现了医学隐含关联1"垂金项目:国家自然科学基金资助项目(编号:6037309
6、5).作者简介:杨志浪.男,博士生,讲师,研究方向为生物信息的文本挖掘技术,yangzhih@dl.cn:林鸿飞,男.博士,教授,研究方向为文本过滤、文本挖掘和自然语言理解,hflin@dlut.edu.cne的存在。雷诺氏病是一种治疗方法和病因都未知的血液循环紊乱,有文献中记载了部分雷诺氏病患者血液中有某种异常,如血液豁度升高。同时,又在其他文献中发现食用鱼油能纠正这种异常,例如,它可以降低血液戮度。因此,Swanson把这两种知识联系起来得出食用鱼油应该对雷诺氏病患者有帮助的假设川。这个假设后来得到了生物科学家的临床验证。许多研究人员在Swanson的研究理念基础上进行了拓展性研究
7、。Gordon和Lindsay采用信息检索的方法对Swanson教授的成果进行了验证,31,Weeber等开发了一个基于自然语言处理的实现食物与疾病关系知识发现系统[E01eSrinivasan使用MEDLINE摘要中的医学主题词McSH(MedicalSubjectHeadings)词汇验证TSwanson的多个医学关联【51在生物医学文献进行隐含知识发现,发现医学概念间的关联,主要是通过判断概念间的相关性.即基于统计学方法,找到概念的相关概
此文档下载收益归作者所有