ncbi站点的一般介绍及其它资源库的介绍

ncbi站点的一般介绍及其它资源库的介绍

ID:8970658

大小:29.26 KB

页数:7页

时间:2018-04-13

ncbi站点的一般介绍及其它资源库的介绍_第1页
ncbi站点的一般介绍及其它资源库的介绍_第2页
ncbi站点的一般介绍及其它资源库的介绍_第3页
ncbi站点的一般介绍及其它资源库的介绍_第4页
ncbi站点的一般介绍及其它资源库的介绍_第5页
资源描述:

《ncbi站点的一般介绍及其它资源库的介绍》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、NCBI站点的一般介绍及其它资源库的介绍EmbanksOverview生物信息学站点地图其它资源库的介绍什么是GenBank?GenBank是一个有13亿碱基,来自于100,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。纪录样本关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。访问GenBank通过EntrezNucleotides来查询。用accessionnumber

2、,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。增长统计参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank增长)小节。公布通知最新-最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。旧-同

3、上相同,是过去公布的统计。遗传密码-15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。向GenBank提交数据关于提交序列数据,收到accessionnumber,和对纪录作更新的一般信息。BankIt-用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体)Sequin提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“networkaware”模式,可以链接到

4、其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)ESTs-表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。RefSeqNCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNAcontigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accessionnumbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx的形式来表示。dbEST—表达序列标签数据库,短的、

5、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。GSSs基因组调查序列,短的、单次(测序)阅读的cDNA序列,exontrap获得的序列,cosmid/BAC/YAC末端,及其他。HTGs-来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。注意:完成的人类的HTG序列可以同时在GenBank和HumanGenomeSequencing页面上访问。STSs序列标签位点短的在基因组上可以被唯一操作的序列,用于产生作图位点。注:SNPs-人类的和其他物

6、种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。国际核苷酸序列数据库合作组织GenBank,DDBJ,EMBL-合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNADataBankofJapan),andEMBL(EuropeanMolecularBiologyLaboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accessionnumber,序列数据和注解都是一模一样的。即,你可以用accessionnumber

7、U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。DDBJ/EMBJ/GenBank特性表特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。FTPGenBankandDailyUpdatesGenBank普通文件格式参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。ASN.1格式—摘要句法

8、记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。FASTA格式定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,不包括EST,STS,GSS,orHTGS序列),

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。