基于web的基因组序列数据库管理系统的设计与实现

基于web的基因组序列数据库管理系统的设计与实现

ID:10186895

大小:2.06 MB

页数:4页

时间:2018-06-12

基于web的基因组序列数据库管理系统的设计与实现_第1页
基于web的基因组序列数据库管理系统的设计与实现_第2页
基于web的基因组序列数据库管理系统的设计与实现_第3页
基于web的基因组序列数据库管理系统的设计与实现_第4页
资源描述:

《基于web的基因组序列数据库管理系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第7卷第2期2009年06月生物信息学ChinaJournalofBioinformaticsVol17No12June,2009基于Web的基因组序列数据库管理系统的设计与实现赵锐1,钱震2,任双喜23(1.苏州大学生命科学学院,江苏苏州215123;2.国家人类基因组南方研究中心,上海201203)摘要:设计一种基于网络的可用来存储和注释海量DNA数据的数据库模型。整个过程分为三部分:首先是构建数据库框架,然后对原始基因组序列数据进行批量注释并输出有效格式导入数据库,最后通过一个友好的用户交互界面,实现对基因组数据的在线读取,查询,注释等操作。设计的数据库用

2、于解决大量产生并有待分析的基因组序列的有效存储和管理问题。关键词:数据库;Web技术;序列注释;DBMS中图分类号:TP31文献标识码:B文章编号:1672-5565(2009)-02-143-03DesignandimplementationofwebbasedgenomesequencedatabasemanagementsystemZHAORui1,QIANZhen2,RENShuang2xi23(1.LifeScienceCollegeofSoochowUniversity,Suzhou215123,China;2.ChineseNationalHuma

3、nGenomeCenteratShanghai,Shanghai201203,China)Abstract:Thispaperaimstodevelopawebbased,databaseschemathatiscapableofstoringandannotatinglargeamountsofDNAdata.Theprojectwasbrokenintothreeparts:framesetofthedatabase,annotationtotherawgenomicsequencesandpracticableflat-filetobeloadedbyda

4、tabase,implementationofafriendlygraphicaluserinterfacetoaccessqueryorannotatesequencedataonline.Thedatabasedesignedisapplyedtosolveproblemsinstoringandmanagementofgenomesequenceswhicharerapidlyproducedandinneedofanalyse.KeyWords:Database;Web;Sequenceannotation;DBMS随着越来越多物种的基因组测序的完成,生

5、物学研究面临了空前的的生物序列信息爆炸。同时,序列的注释信息变得越来越复杂和大量。DDBJ早在1995年就意识到DNA序列数据库将面临即将来到的新的挑战1。EMBL、DDBL、GenBank核酸数据库自从1994年起,其数据量以每14个月翻一番增生菌和模式生物。WGS为主要的测序方法。作为重要的模式生物之一,基因组测序计划将加快基因的发现与研究3。为了适应基因组序列数据结构的重要变化和快速增长的数据量,本文提出了一种新的数据库数据库模型。在新的数据库模型下,序列数据的结构和注释信息彼此独立存储,使得序列数据本身结构的变化不会影响到对序列的注释。同时设计一个方便易

6、操作的网络交互平台,实现对序列的查询和注释。长2。如今,生物数据库的更新速度不断加快,数据量呈指数增长趋势,数据库使用频率增长更快,数据库的复杂程度不断增加,网络化成为趋势,应用不断增强,先进的软硬件配置不断更新。如何有效存储和管理生物序列数据是生物信息学需要解决的重要问题之一。真菌是真核生物的一个庞大门类。据统计,全世界有150万种真菌,其中已被描述的仅74,000到120,000种。基因组信息可以加深人们对真菌遗传和生理多样性的认识。截至目前,在NCBI上已公布了141个真菌基因组测序计划(http:ΠΠwww.ncbi.nlm.nih.govΠGenome

7、sΠ)。这些真菌基因组大小为215~8115Mb,包括重要的人类病原菌、植物病原菌、腐系统的架构设计与方法1系统建立在一个真菌基因组序列数据库基础上。实现对序列及序列的对应注释信息进行有效存储,并实现优化查询。1.1数据来源要实现这个具有注释功能的基因组序列数据库,需要对获得的基因组序列数据进行有效注释,并组织成一定格式输入数据库。收稿日期:2008-04-28;修回日期:2008-07-14.基金项目:863计划(2006AA02Z188)资助项目。作者简介:赵锐(19-),男,江苏常州人,硕士研究生。E-mail:zzqr@163.com.3通讯作者:任双喜

8、,e-mail:rens

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。