基于数据仓库的病毒序列集成数据库系统研究-论文.pdf

基于数据仓库的病毒序列集成数据库系统研究-论文.pdf

ID:53029598

大小:790.94 KB

页数:3页

时间:2020-04-14

基于数据仓库的病毒序列集成数据库系统研究-论文.pdf_第1页
基于数据仓库的病毒序列集成数据库系统研究-论文.pdf_第2页
基于数据仓库的病毒序列集成数据库系统研究-论文.pdf_第3页
资源描述:

《基于数据仓库的病毒序列集成数据库系统研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第22卷第5期鄂州大学学报20l5年5月Vo1.22No.5JournalofEzhouUniversityMay.2015基于数据仓库的病毒序列集成数据库系统研究蔡伟珊(韩山师范学院信息工程部,广东潮州521041)摘要:目前国际上病毒序列数据库存在分散分布、异构等弊端,这在一定程度上降低了这些序列信息的可用性。此外,只有少数的生物数据库由国内开发和维护。针对绝大多数的病毒,提出了一个病毒序列数据集成系统框架。该框架引入数据仓库集成思想.包括数据源层、数据抽取层、数据集成层和Web应用层等四个层次。该文以流感病毒为

2、例,详细介绍了一个基于该框架的流感病毒序列集成数据库原型FLUDW的实现过程。该系统框架可作为建立其它病毒序列数据库的模板。关键词:集成系统;数据仓库;数据库;病毒序列;生物序列中图分类号:TP311.13文献标识码:A文章编号:1008—9004(2015)05—0104—03.系统应用层1概述进行智能的多重、复合和交叉检索Dl。数据仓库集成强调的不随着测序技术的发展及成本的不断降低,存储和管理是检索的转换,而是实际数据源的转换集成。因此,相比之下海量的、呈指数增长的生物数据的生物数据库成为生物信数据仓库集成系统减

3、少了对网络数据实时访问性能的依赖。息学的重要任务。近年来随着国际上生物序列数据库逐渐有效地消除了如网络瓶颈、低响应时间和突发的数据源不可增多【1.生物序列数据的分布性、异构性等问题日益突出。用等问题。同时,由于数据仓库的特殊特征,数据仓库集成也目前我国生物信息领域研究所用的数据和生物信息资方便构建面向特定主题的数据库,提高数据检索速度,并实源基本依赖国外的数据库。国外对生物信息数据的垄断,在现对决策支持的检索。目前采用数据仓库方法的系统有一定程度上影响我国的生物信息学、医学及其相关产业的发GU,BioMolOuest

4、~。InterP等。展.也可能对研究结果造成不可预知的影响。为解决这个问3病毒序列数据库集成系统架构题.国家科技部于2010年启动了国家科技基础性工作专项数据仓库中的数据集成不是简单的传统数据库的数据重点项目“生物信息学基础信息整编”项目。堆积,也不是简单地选择一个工具下载数据的过程。它是一本文引入数据仓库集成思想,提出一个基于数据仓库个复杂的容纳数据集成的系统工程171。如图1为本文构建集成的生物病毒序列数据集成系统框架,并在此基础上实现的集成系统架构。一个面向流感病毒序列数据仓库原型系统FLUDW。该系统通过对远

5、程分散的序列数据的抽取、筛选、优化等手段实现数据的本地化。因此该系统既能促进本地序列数据的高效共享和利用.也可满足国内生物信息研究的需求,为实现对生物序列信息的进一步知识挖掘提供有力的支持。2生物数据集成研究当前常见的数据集成方法主要有中问件集成、导航集成和数据仓库集成三种I21。随着生物信息量的增长和研究需求的扩大,提供集成服务中间件软件的发展远远落后于序列数据量的增长和研究需求。导航集成系统的数据检索几乎全部都在检索界面上通过点击完成,具有较大的实用价值.但其缺点是不具备良好的可扩展性。而数据仓库集成是从不同数据

6、库中提取数据后将它们集成并存储到一个集中的数据库中,然后再对集成的数据库图1病毒序列数据库集成系统架构收稿日期:2014—10—28作者简介:蔡伟珊(1986一),女,广东潮州人,助教,研究方向:高性能数据库和数据仓库。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。