基于web的基因组序列数据库管理系统的设计与实现

基于web的基因组序列数据库管理系统的设计与实现

ID:20700825

大小:306.89 KB

页数:6页

时间:2018-10-15

基于web的基因组序列数据库管理系统的设计与实现_第1页
基于web的基因组序列数据库管理系统的设计与实现_第2页
基于web的基因组序列数据库管理系统的设计与实现_第3页
基于web的基因组序列数据库管理系统的设计与实现_第4页
基于web的基因组序列数据库管理系统的设计与实现_第5页
资源描述:

《基于web的基因组序列数据库管理系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、生物信息学ChinaJournalofBioinfonnatics基于Web的基因组序列数据库管理系统的设计与实现赵锐收稿曰期:2008-04-28;修回曰期:2008-07-14.基金项目:863计划(2006AA02Z188)资助项目。,钱震作者简介:赵锐(19->,男,江苏常州人,颀士硏究生。E-mail:zzqr@163.oom.,任双喜2通讯作者:任双喜,e-mail:rensx@chgc.sh.cn,Td:021-38953523.(1.苏州大学生命科学学院,江苏苏州215123;2.国家人类基囚组南方硏究中心,上海201203)摘要:设计

2、一种基于网络的可用来存储和注释海景DNA数据的数据库模型。整个过程分为三部分:首先是构建数据厍框架,然后对原始基因组序列数据进行批景注释并输出有效格式导人数据厍,最后通过一个友好的用户交互界面,实现对基因组数据的在线读取,查询,注释等操作◊设计的数据库用于解决大景产生并有待分析的基因组序列的有效存储和管理问题,关键词:数据库;Web技术;序列注释;DBMS中图分类号:TP31文献标识码:B文京编号:1672-5565(2009)-02-143-03Designandimplementationofwebbasedgenomesequencedataba

3、semanagementsystemZHAORui1,QIANZhen,RENShuan^xi23(I•LifeScienceCollege(/Sooch(wUnive⑸ty,Sichou215123,China:2.ChineseNatioiuilHumanGenofneCenteratShanghai,Shanghai201203,China)Ahstract:Thispaperaimstodevelopawebbased,databaseschemathatiscapableofstoringandannotatinglargeamountsof

4、DNAdata.Theprojectwasbrokenintothreeparts:framesetofthedatabase,annotationtotherawgenomicsequencesandpracticableflat-filetobeloadedbydatabase,implementationofafriendlygraphicaluserinterfacetoaccessqueryorannotatesequencedataonline.Thedatabasedesignedisapplycdtoa)lvcprablcmsinsto

5、ringandmanagementofgenomesequenceswhicharcrapidlyproducedandinneedofanalyse.KeyWords:Database;Web;Sequenceannotation;DBMS随着越来越多物种的基因组测序的完成,生物学研究面临了空前的的生物序列信息爆炸。同时,序列的注释信息变得越来越复杂和大以,DDBJ导在1995年就意识到DNA序列数据库将面临即将涞到的新的挑战1,EMBLDDBL

6、加快,数据量呈指数增长趋势,数据库使用频率增长更快,数据库的复杂程度不断增加,网络化成为趋势,应用不附增强,先进的软硬件配置不断更新。如何有效存倩和管理生物序列数据是生物信息学需要解决的重要问题之一。真菌是真核生物的一个庞大门类。据统计,全世界有15()万种真菌,其中已被描述的仅74,0()0到120,000种。基因组信息可以加深人们对真菌遗传和生理多样性的认识。截至目前,在NCBI上已公布了141个真菌基因组测序计划(httpnebinlm.nih.gnTDsmmesn。这些真菌基因组大小为215〜8115Mb,包括重要的人类病原菌植物病原菌腐生菌和

7、模式生物。WGS为主要的测序方法。作为重要的模式生物之一,基因组测序计划将加快基因的发现与研究3。为了适应基因组序列数据结构的重要变化和快速增长的数据量,本文提出了一种新的数据库数据库模型。在新的数据库模型下,序列数据的结构和注释信息彼此独立存储,使得序列数据本身结构的变化不会影响到对序列的注释。同时设计一个方便易操作的网络交互平台,实现对序列的查询和注释。1系统的架构设计与方法系统建立在一个真菌基因组序列数据库基础上。实现对序列及序列的对应注释信息进行有效存储,并实现优化查询。1.1数据来源要实现这个具有注释功能的基因组序列数据库,需要对获得的基因组

8、序列数据进行有效注释,并组织成一定格式输人数据库。测试的基因组序列是国家人类基因组南方硏究中心

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。