生物信息整理(大概总纲)

生物信息整理(大概总纲)

ID:46586180

大小:1.01 MB

页数:17页

时间:2019-11-25

生物信息整理(大概总纲)_第1页
生物信息整理(大概总纲)_第2页
生物信息整理(大概总纲)_第3页
生物信息整理(大概总纲)_第4页
生物信息整理(大概总纲)_第5页
资源描述:

《生物信息整理(大概总纲)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第一章DNA,RNA和蛋白质序列信息资源1.数据库分类:一次数据库:①基因组数据库②核酸和蛋白质一级结构序列数据库③生物大分子(主要是蛋白质)三维空间结构数据库二次数据库(专门数据库,专业数据库,专用数据库):根据以上三类数据库和文献资料为基础所构建。2.三大核酸序列数据库GenBank:美国国家医学图书馆的国家生物技术中心(NCBI)构建和维护,来自世界各地数据。是具有目录和生物学注释的核酸序列综合数据库;GenBank数据库的序列数据来源于序列发现者提交的序列、批量提交的表达序列标签(expressed

2、sequencetag,EST)、基因组测序序列(genomesurveysequence,GSS)和其他测序中心提供的高通量数据,还包括美国专利商标局提供的已发表专利的序列数据;NCBI的BLAST程序提供GenBank和其他序列数据库中序列相似性搜索服务;通过NCBI的检索系统(Entrez)可以进入GenBank。Entrez检索程序整合了主要的DNA和蛋白序列数据的分类学、基因组、图谱、蛋白结构和结构(功能)域信息,还包括相关的PubMed的生物医学文献信息。GenBank记录和分类:表达序列标签(E

3、ST)序列标签位点(STS)、基因组勘测序列(GSS)和环境样品序列(ENV)高通量基因组(HTG)和高通量cDNA(HTC)序列全基因组鸟枪测序序列(WGS)转录组鸟枪组合序列特殊记录类型:第三方注释(TPA)GenBankCON记录较小记录组合记录EMBL:欧洲生物信息中心(EBI))构建和维护,来自世界各地数据.DDBJ:信息生物学中心和国家遗传研究生的日本DNA数据库构建,主要来自日本的数据。三大数据库每天都会进行数据交换,以保证数据库内容在全世界范围的同步性。3.特殊类型核酸序列数据库非编码RNA数

4、据库(ncRNA);表达序列标签数据库(dbEST);序列标签位点数据库(dbSTS);miRBase;tRNAdb等。4.基因组相关数据库人类基因组数据库(HGD);基因组序列数据库(GSDB);基因组在线数据库(GOLD)等5.核酸三维结构数据库核苷酸三维结构数据库(NDB)普纳大学核酸结构数据库(BNASDB)6.基因表达数据库基因表达库(GEO);斯坦福微阵列数据库(SMD);ArrayExpress;CGED;GXD;BodyMap等。7.人类基因突变及疾病相关数据库人类基因变异数据库(HMGD);

5、人类遗传双等位基因序列数据库(HGBASE);人类孟德尔遗传在线(OMIM)、国际单体型计划(HapMap)、人类单核苷酸多态性数据库(dbSNP)、肿瘤基因数据库(TGDB)、疾病关联数据库(GAD)、癌症基因数据库(CGAP)、人类表观遗传数据库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer)等。8.其他重要的核酸序列数据库dbEST:dbEST是GenBank中的一个子数据库,包含来源于不同物种的表达序列数据和表达序列标签序列的其他信息。ncRNAdb:非编码RNA(non-codi

6、ngRNAncRNA)数据库旨在提供非编码RNA的序列和功能信息。miRBase:miRBase序列数据库主要存放已发表的微小RNA(microRNAmiRNA)序列和注释的数据库。9.蛋白质相关数据库蛋白质序列数据库(PIR,MIPS,Swiss-Prot)蛋白质三维结构数据库(PDB,BioMagResBank,SCOP,CATH等)蛋白质组数据库(二维凝胶电泳数据库)(WORLD-2DPAGE,Phoretixlinks)信号传导及蛋白质-蛋白质相互作用相关数据库(DIP,INTERACT,ProNet

7、,KEGG等)DNA和蛋白质相互作用数据库等蛋白质相关数据库(DPInteract)。10.PIR数据库①PIR主要数据库1.UniProt-通用蛋白质资源库:是存储和链接其他蛋白质数据库的资源库,并且是蛋白质序列和具有综合功能注释目录的中心资源库。使用UniprotKB可以检索准确、可靠的蛋白综合信息。使用UniRef可以减少冗余,加速序列相似性搜索。使用UniParc可以检索存档序列和它们来源的数据库。2.iProClass-蛋白质知识整合数据库:使用iProClass可以检索最新的蛋白质综合信息,包括:

8、功能、转导通路、相互作用、家族分类、基因和基因组、功能注释标准体系(ontology)、文献和分类学信息。使用iProClass还可以检索ID图谱、蛋白质词典和相关序列。3.PIRSF-蛋白质家族分类系统:分类系统概要论述家族的特征,如家族名称、分类分布、分级和功能域结构,以及家族成员,包括功能、结构、传导通路、功能注释标准体系(ontology)和家族分类。利用这些信息可以获得蛋白质的准确功能或预

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。