欢迎来到天天文库
浏览记录
ID:37231500
大小:1.89 MB
页数:77页
时间:2019-05-20
《生物信息学-功能预测与注释》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、生物信息学功能预测与注释吴凌云中国科学院数学与系统科学研究院http://zhangroup.aporc.org基因组注释•Genomeannotation•利用生物信息学方法,对基因组各组成部分进行识别,并对其生物学功能进行注释•主要内容–基因识别与功能注释–非编码基因的识别与功能注释–调控元件的识别与功能注释–影响染色体结构和动力学的序列基因的识别与功能注释•基因预测•序列搜索•序列motif•直系同源序列聚类分析(COG)•亚细胞定位•结构比较•蛋白质组学序列搜索•假设:序列相似=同源=功能相似•数据库–NCBI-NT(非冗余核酸序列数据库)–NCBI-NR(非
2、冗余蛋白质序列数据库)–InterPro(Swissprot)(蛋白质序列数据库)–KEGG–PDBseq(已知三维结构的蛋白质序列数据库)序列motif•查找序列上的局部特征•在序列同源性不明显的情况下使用•Motif数据库构建–对蛋白质家族成员进行多序列比对•数据库–Prosite同源•直系同源(Ortholog)–不同物种中由同一祖先进化而来的多个基因–功能较一致•旁系同源(Paralog)–同一基因组内由于基因复制而来的多个基因–功能差异较大直系同源与旁系同源直系同源序列聚类分析•假设:直系同源=功能相似•数据库–COGs(ClustersofOrtholog
3、ousGroupsofproteins)–EachCOGconsistsofindividualproteinsorgroupsofparalogsfromatleast3lineagesandthuscorrespondstoanancientconserveddomain.亚细胞定位•假设:蛋白质的亚细胞定位与功能相关•通过预测亚细胞定位来预测功能结构比较•假设:结构决定功能•预测未知基因的蛋白质结构,再通过结构比较预测其功能蛋白质组学•假设:功能相关的蛋白质可能倾向于有相互作用•从蛋白质相互作用网络或者其他生物分子网络来预测蛋白功能Function•Thewor
4、dfunctionwithinabiologicalcontextisanevolvingconceptandisusedinmanyways.•Functioncanbedescribedatmanylevels,rangingfrombiochemicalfunctiontobiologicalprocesses,allthewayuptotheorganismlevel.•Ifonlysayaproteinhassomefunction,thathasfewmeaningtobiologist.ClassificationofFunction•EC–Enzyme
5、Commissionscheme•FunCat–MIPSFunctionalCatalogue•GO–GeneOntologyEC•EnzymeCommissionnumber–Basedonthechemicalreactionstheycatalyze.–EveryECnumberisassociatedwitharecommendednamefortherespectiveenzyme.–Strictlyspeaking,ECnumbersdonotspecifyenzymes,butenzyme-catalyzedreactions.–Ifdifferente
6、nzymes(forinstancefromdifferentorganisms)catalyzethesamereaction,thentheyreceivethesameECnumber.KEGGPatywayMIPSFunCatGeneOntology(GO)•Unifytherepresentationofgeneandgeneproductattributesacrossallspecies–Maintainandfurtherdevelopitscontrolledvocabularyofgeneandgeneproductattributes–Annot
7、ategenesandgeneproducts,andassimilateanddisseminateannotationdata–ProvidetoolstofacilitateaccesstoallaspectsofthedataprovidedbytheGeneOntologyprojectGODomains•ThreeseparateGOdomains–Molecularfunctions–Biologicalprocesses–Cellularcomponents•Eachgeneorgeneproductmay–havemorethano
此文档下载收益归作者所有