欢迎来到天天文库
浏览记录
ID:37428608
大小:970.60 KB
页数:41页
时间:2019-05-12
《结构基序预测蛋白质功能》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基础知识汇报在类的合并上,主要有三种算法来确定类间的距离:单一连锁(single-linkage)、完全连锁(complete-linkage)和平均连锁(average-linkage)。这三种算法在定义类间的距离时分别取两类间的最小距离、最大距离和平均距离。前两种算法对边缘值太过敏感,对于未知的元素分布,一般采用平均连锁算法。完全连锁(completelinkage),又称最远邻(furthestneightbour)方法。同样从相似度矩阵或距离矩阵出发,但定义距离为两类之间数据的最大距离。同样不考虑到类的结构。倾向于找到一些紧凑的分类。以最小近邻法聚
2、类为例最短距离聚类法具有空间压缩性,而最远距离聚类法具有空间扩张性。最短距离为dAB=da1b1,最远距离为dAB=dap2。表示了八种不同系统聚类方法计算类间距离的统一表达式CompositeStructuralMotifsofBindingSitesforDelineatingBiologicalFunctionsofProteins汇报人:刘言简介在原子水平上,我们都是通过蛋白质之间或蛋白质与其他分子之间相互作用来理解生物学过程的。大部分蛋白质会同步或不同步的与很多分子相互作用。单原子离子,小分子到蛋白质、核酸和其他大分子众所周知,蛋白质相互作用的类
3、型和蛋白质是否相互作用可以调节蛋白质的功能(血红蛋白与氧结合,与一氧化碳结合)。因此,我们不仅要确定个体蛋白的相互作用,也要考虑潜在的蛋白质相互作用,这些相互作用或许可以充分描述蛋白质的功能,也能从同源蛋白中区分它们的不同功能。Genomesequencetechnologies促使我们更加急迫的去发掘从序列信息预测蛋白质功能的有效技术。迄今为止,最常用于蛋白质功能预测的方法是annotationtransfer,它是基于一种蛋白质序列相似,功能相似的假设基础上的方法。然而,随着研究的逐步深入,这种方法在很多情况下却是不可靠的。蛋白质功能相似,并不仅仅是序
4、列功能的相似。蛋白质序列折叠方式不同,会导致结构不同,从而影响功能。所以我们要更加精细的检查蛋白质功能的决定因素,而不是只单纯的考虑蛋白质序列相似性。结构信息可以为蛋白质功能预测提供更加准确的信息。Todate,therehavebeenmanymethodsfordetectingpotentialligandbindingsitesbasedonstructuralsimilarityofproteins[14,16–22].Mostofthesemethodsaretargetedatpredictingproteinfunctionsatthele
5、velofligandbindingandcatalyticactivity.Therehavealsobeenmanystudiesonprotein-proteininteractioninterfacestounderstandbiologicalfunctionsofproteinsincellularcontexts。然而,大部分研究都是针对于一些特殊的相互作用本身和不明确机理的相互作用如何调控蛋白质的生物学功能的。文中思想为了明确原子水平上蛋白质相互作用的模式与其功能的关系,在这里我们采用一个非常详尽的all-against-allstruct
6、uralcomparisonsofbindingsitestructuresatatomiclevelusingallstructuresavailableintheProteinDataBank(PDB)。1.Identificationofelementaryandcompositemotifs首先,我们找到PDBMLfile中所有有注释的生物学单元,然后从中提取出197690个蛋白质亚基(这些亚基均至少包含一个配体结合位点)这里,我们把一个亚基的配体结合位点定义为一个亚基的原子集(与配体原子的距离在5A之内)。然而我们不用已知的基于序列相似性的非冗余
7、数据库,我们的冗余在相似结构聚类之后再清理。通过这种方式,确定在后续的分析中当结构冗余条件移除后高度相似的蛋白质结构差异或相同的氨基酸序列是否能够preserved。KinjoAR,NakamuraH(2007)Similaritysearchforlocalproteinstructuresatatomicresolutionbyexploitingadatabasemanagementsystem.All-against-allstructure用GIRAF结构搜索和排列程序比对410254小分子结合位点,346288蛋白质结合位点和20388核酸结合
8、位点。完全连锁聚类后各自输出5869,7678和398簇(至少有十
此文档下载收益归作者所有