基于数据挖掘技术的知识服务体系

基于数据挖掘技术的知识服务体系

ID:33125871

大小:676.00 KB

页数:9页

时间:2019-02-20

基于数据挖掘技术的知识服务体系_第1页
基于数据挖掘技术的知识服务体系_第2页
基于数据挖掘技术的知识服务体系_第3页
基于数据挖掘技术的知识服务体系_第4页
基于数据挖掘技术的知识服务体系_第5页
资源描述:

《基于数据挖掘技术的知识服务体系》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、腿蚃虿艿节蒆羇芈莄蚁袃芇薆蒄衿芆芆蝿螅袃莈薂蚁袂蒀螈羀袁膀薁袆袀节螆螂罿莅蕿蚈罿蒇莂羇羈芇薇羃羇荿蒀衿羆蒁蚅螅羅膁蒈蚁羄芃蚄罿羃莆蒆袅肃蒈蚂螁肂膈蒅蚇肁莀蚀蚃肀蒂薃羂聿膂蝿袈肈芄薁螄肈莆螇蚀肇葿薀羈膆膈莂袄膅芁薈螀膄蒃莁螆膃膃蚆蚂膂芅葿羁膂莇蚅袇膁蒀蒇螃芀腿蚃虿艿节蒆羇芈莄蚁袃芇薆蒄衿芆芆蝿螅袃莈薂蚁袂蒀螈羀袁膀薁袆袀节螆螂罿莅蕿蚈罿蒇莂羇羈芇薇羃羇荿蒀衿羆蒁蚅螅羅膁蒈蚁羄芃蚄罿羃莆蒆袅肃蒈蚂螁肂膈蒅蚇肁莀蚀蚃肀蒂薃羂聿膂蝿袈肈芄薁螄肈莆螇蚀肇葿薀羈膆膈莂袄膅芁薈螀膄蒃莁螆膃膃蚆蚂膂芅葿羁膂莇蚅袇膁蒀蒇

2、螃芀腿蚃虿艿节蒆羇芈莄蚁袃芇薆蒄衿芆芆蝿螅袃莈薂蚁袂蒀螈羀袁膀薁袆袀节螆螂罿莅蕿蚈罿蒇莂羇羈芇薇羃羇荿蒀衿羆蒁蚅螅羅膁蒈蚁羄芃蚄罿羃莆蒆袅肃蒈蚂螁肂膈蒅蚇肁莀蚀蚃肀蒂薃羂聿膂蝿袈肈芄薁螄肈莆螇蚀肇葿薀羈膆膈莂袄膅芁薈螀膄蒃莁螆膃膃蚆蚂膂芅葿羁膂莇蚅袇膁蒀蒇螃芀腿蚃虿艿节蒆羇芈莄蚁袃芇薆蒄衿芆芆蝿螅袃莈薂蚁袂蒀螈羀袁膀薁袆袀节螆螂基于数据挖掘技术的知识服务体系——以生命科学领域内GOPubMed为例谢岩岩1,2孙继林11中国科学院国家科学图书馆,北京,1001902中国科学院上海生命科学信息中心,上海20

3、0031摘要:随着生物文献的急剧增长,找到相关文献进行数据挖掘成为新的重点和难点,GOPubMed基于GO和MeSH搜索PubMed,通过标引和分类,可以有效地提高查找相关文献的准确率。GOPubMed的实现为图书馆进行知识服务提供了一种参考模式:通过各类数据库的关联整合,运用本体和主题词表等对其进行数据挖掘,达到知识扩展和知识发现。关键词:GOPubMed;GO;术语提取;实体识别;知识服务KnowledgeServicesystemonDataMining:GOPubMedinlifescience

4、sXieYanyanSunJilinLibraryofChineseAcademyofSciences,Beijing100190ShanghaiIntelligenceCenterforlifeSciences,CAS,Shanghai200031ABSTRACT:Thebiomedicalliteraturegrowsatatremendousrate.Findingrelevantliteratureisanimportantanddifficultproblem.WeintroduceGOPub

5、Med,awebserverwhichallowsuserstoexplorePubMedsearchresultswiththeGeneOntology(GO),ahierarchicallystructuredvocabularyformolecularbiology.ItgivesanoverviewoftheliteratureabstractsbycategorizingabstractsaccordingtotheGOandthusallowinguserstoquicklynavigate

6、throughtheabstractsbycategory.Keywords:GOPubMed;GO;TermExtract;EntityRecognition;KnowledgeService随着生物文献数量的急剧增长,文献间的知识挖掘和管理成为用户的另一难点。利用现有数据库已可以实现蛋白质互作、生物循环路径发现等研究目地,但是传统的基于关键词的文献检索存在两种不足:①用户需要具备很强的专业知识搜索技能,才能选取合适的关键词和逻辑表达式达到检索目的;②检索结果呈线性排列,用户很难发现结果之间的复杂关系

7、,无法进行深一步的知识挖掘;而且一般情况下,用户只是点击排名靠前的文献,因此排序靠后但有价值的文献会被遗漏。本文将介绍一个基于本体构建的网络搜索引擎GOPubMed[1],GOPubMed是基于PubMed的检索工具。当用户将检索词提交给PubMed后,GOPubMed会接收PubMed的检索结果,利用GO(geneontology,GO—基因本体)和MeSH(医学主题词表)对检索结果进行提炼,从中提取GO术语和MeSH主题词,对检索结果进行聚类和关联,并提供相关文献、作者、研究机构、国家或地区的可视化

8、结果,有以下优点:①提供基于基因本体的摘要分类概览,帮助用户实现分类摘要的快速导航;②自动提供与提问相关的GO术语;③与文献相关的GO概念在文献摘要中有所标识,保证用户及时查看验证文献内容分类;④使用GOPubMed搜索PubMed时,会出现相关的GO术语定义及解释。1生命科学数据库背景知识[2]随着生命科学的不断发展,各种专业数据库(基因序列库、蛋白质序列库等)和文献数据库(如PubMed)之间的关联和挖掘成为新的需求。GOPubMed主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。