运用文本数据库中元数据关联规则进行知识发现的研究

运用文本数据库中元数据关联规则进行知识发现的研究

ID:21159671

大小:3.23 MB

页数:55页

时间:2018-10-18

运用文本数据库中元数据关联规则进行知识发现的研究_第1页
运用文本数据库中元数据关联规则进行知识发现的研究_第2页
运用文本数据库中元数据关联规则进行知识发现的研究_第3页
运用文本数据库中元数据关联规则进行知识发现的研究_第4页
运用文本数据库中元数据关联规则进行知识发现的研究_第5页
资源描述:

《运用文本数据库中元数据关联规则进行知识发现的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物医学文本挖掘研究的体会中国医科大学信息管理与信息系统(医学)系主要内容开展的课题“运用文本数据库中元数据关联规则进行知识发现的研究”文本挖掘工具课题申请的体会运用文本数据库中元数据关联规则进行知识发现的研究文本数据库:PubMed元数据:关于数据的数据,MeSH主题词关联规则:associationrule,在同一个事件中出现的不同项的相关性,如在一次购物活动中所购商品的相关性(尿布→啤酒:30%~40%)事件:一篇论文;不同项:MeSH主题词MeSH主题词在同一篇文章中出现有规律吗?可否利用这种关联规律来发现知识?背景知识知识发现(KDD

2、):从数据中正规提取隐含的、以前未知的并且可能有用的知识。数据挖掘:在数据中正规地发现有效的、新颖的、潜在有用的、并且最终可以被读懂的模式的过程。一般可以把数据挖掘当作知识发现的一个具体步骤。背景知识文本挖掘TextMining:文本挖掘LiteratureBasedDiscovery(LBD):基于文献的发现KnowledgeDiscoveryinBiomedicalLiterature(KDiBL):生物医学文献知识发现背景知识Cimino的研究哥伦比亚大学。如果在一篇文献纪录中同时存在“疾病类主题词/化学诱导副主题词”和“药物类主题词/副

3、作用副主题词”这样的组合的话,那么可以建议该疾病由该化学物质(药物)引起。If/chemicallyinducedAND/adverseeffectsThenisCausedby.形成规则。将这样的规则运用的具体的其他文献集合中,就会发现文献中报道了大量的具体疾病是由某一种具体药物引起的。形成关系。背景知识规则的文字形式:“如果某一文献记录中含有属于1类的主题词A并且和副主题词X在一起,AND该引文还包括属于2类的主题词B并且和副主题词Y在一起,那么建议A和B通过关系Z

4、相关(A和B有Z关系)。”根据Medline主题词和副主题词在同一篇文献中出现的情况,建立起主题词和副主题词之间的关联规则,然后将这些规则返回到具体的文献中形成了具体概念之间的关系。本课题目标寻找发现规则的方法。将获得规则用于某一领域,得到具体的关系。运用具体的关系开发出专题的知识库。技术路线下载专题文献截取高频M/S共词聚类分析高频M/S组合形成待检规则得不到关系得到关系返回具体文献发现新知识形成规则Swanson模式专家评价开发知识库分析样本:下载文献三个层次微观层次:各个大类下的10个末级主题词中观层次:针对每一种副主题词进行检索宏观层次

5、:直接以大类名为检索策略http://bioinformatics.ualr.edu/dan/medkit/关键点确定高频主题词截取阈值,共词聚类分析最佳分组数目,伪F检验。候选规则检验。规则是否成立。规则是否可靠?专家评分,敏感度等。不成立组合的分析:swanson模式,关系?知识库开发。取得的成果方法是可行的。得到的规则。开发出相应的数据挖掘平台。BICOMSMeSH_Manager建立各种专题、主题的知识库。规则样例M1S1M2S2M1/S1SRM2/S2A02PathologyG06null的病态结构作为…的结果代谢过程A02Physi

6、ologyG11Physiology的生理功能是...的位置的生理变化A02PhysiopathologyG11Physiology的异常功能破坏的生理变化A02MetabolismG04Physiology的代谢变化是...的位置的生理变化A02MetabolismD09Metabolism的代谢变化是...的位置的分解代谢A03DrugEffectsG06DrugEffects受药物作用发生了受药物作用A05DrugEffectsA05Metabolism受药物作用影响的代谢变化A07MetabolismD27Pharmacology的代谢

7、变化受...影响的药理作用A07DrugEffectsG09DrugEffects受药物作用发生了受药物作用A07DrugEffectsA07Physiology受药物作用影响的生理功能A08DrugEffectsG05DrugEffects受药物作用发生了受药物作用今后的方向应用领域上,向生物信息学靠拢;实行中,寻求获得经济效益的可能;学科上,最终目标是知识发现;方法上,探索本体论在医学领域中的应用。二、数据挖掘工具文本挖掘的主要内容术语识别信息抽取发现关系TextMiningToolsSemanticKnowledgeRepresentat

8、ion/语义知识表征项目,SKRhttp://0-skr.nlm.nih.gov.catalog.llu.edu/美国国立医学图书馆,1998年启动文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。