欢迎来到天天文库
浏览记录
ID:20505926
大小:126.10 KB
页数:17页
时间:2018-10-10
《Amber 教程.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、研究案例——一种稳定蛋白质的全部原子结构预测和折叠模拟这段教程展示的是一个研究实例,像您演示如何重现下述文章中的研究工作:Simmerling,C.,Strockbine,B.,Roitberg,A.E.,J.Am.Chem.Soc.,2002,124,11258-11259(http://dx.doi.org/10.1021/ja0273851)我们建议您在开始本教程前首先阅读上述文章,获得该蛋白的氨基酸序列及其他有用信息。警告1:本教程中的一些计算耗时很长,我使用了由16个1.3GHzcup的SGIAltix进行了27小时计
2、算才完成整个工作,因此如果您没有足够的计算能力,我强烈建议您在重复本教程的过程中使用我为您提供的out文件,以使得您能够流畅地完成整个教程。警告2:如果您重复本教程,我们并不能保证您能够精确地重现我的计算结果,在计算过程中,不同结构的计算机会产生不同的近似误差,从而使得计算过程搜索的是相空间的不同部位,但是模拟的平均结果是大致相同的。另外,尽管您完全重复了本教程也有可能无法获得论文中给出的结果,而且即便是我们自己也无法保证论文中的结果能够重现,这可能是因为我模拟的时间不够长,获取的仅仅是一个局部最小点,但是尽管如此,本教程的工作
3、还是展示了蛋白折叠中一些有趣的行为。背景这篇论文应用AMBERFF99力场和经典的全原子动力学对一个肽的折叠过程进行了模拟。模拟的对象"trpcage"是一个由20个氨基酸构成的小肽,华盛顿大学的Andersen已经对这个蛋白做过了结构优化,它是现在已知最小的能够显示两种不同折叠状态的蛋白,而且这个蛋白在室温下可以稳定存在。该蛋白的小身量使得它成为模拟蛋白质折叠的绝嘉对象。当最早的关于这个蛋白的折叠的计算结果出炉时,对这个蛋白结构的实验测定还没有完成,所以整个模拟过程是在没有实验数据作为指导的情况下完成的。当蛋白的结构经由实验手
4、段测定之后,人们惊喜地发现,计算机模拟的结果与实验测定的数值之间的RMSD值仅为1.4A。考虑到整个模拟过程是从蛋白的一级结构开始并且完全没有同源蛋白作为参考,这样的一个计算结果是非常精确的。本教程中,我们试图重复论文中的结果,计算的设定都与论文非常接近,只是由于计算能力的限制,在教程中我们只进行一个50ns级的模拟。这已经足够重见蛋白质折叠的结果了。在这里必须提醒的是,由于模拟过程的长度所限,在不同的计算机,或在处理器数量不同的情况下,计算的结果将会是不同的。这是由分子动力学模拟的方法决定的,实施过程的细微变化或者浮点计算中舍
5、入的变化都意味着由不同的计算机进行采样的动力学轨迹会随着时间的流逝发生不可预知的分化。这并非误差或者程序的bug,也并不意味着某一个模拟过程比其他的过程更合理。这仅仅意味着不同的模拟过程搜索的是相空间的不同区域,如果我们平均一下模拟的结果,或者运行更长时间的动力学过程,我们会在不同的机器上得到完全相同的结果,他们之间仅仅在过程上有所不同。因而我们说在本教程中我们很难精确的再现论文中的结果,但是我们试图重新创造那个重要的结果,即用AMBER程序来预测一个20氨基酸的小蛋白的空间结构是可以完成的。那么记住这一点,让我们开始吧第一步:
6、构建起始结构在以往的教程中,我们要么有一个可用的晶体结构,要么可以通过程序生成一个已经初步优化的结构。而在这个教程中我们要用的结构太复杂,没法通过手画的办法完成,同时我们也没有一个可用的PDB结构,因此我们就需要构建一个线形的肽链,非常幸运的是,在LEAP中有一个命令可以完成这个工作,就是sequence。蛋白的一级结构序列在所列论文中可以查到,如下所示:NLYIQWLKDGGPSSGRPPPS这是用单字母符号显示的蛋白质一级结构序列,在Leap中使用之前我们需要将其转换成标准的三字母表示下面的表格给出了单字母表示和三字母表示之
7、间的转换关系:单字母与三字母的转换conversionGPAVLIMCFYWHKRQNEDST甘氨酸(Gly)脯氨酸(Pro)丙氨酸(Ala)缬氨酸(Val)亮氨酸(Leu)异亮氨酸(Ile)蛋氨酸(Met)半胱氨酸(Cys)苯丙氨酸(Phe)酪氨酸(Tyr)色氨酸(Trp)组氨酸(His)赖氨酸(Lys)精氨酸(Arg)谷氨酸盐(Glu)天冬酰氨(Asn)谷氨酸(Glu)天冬氨酸(Asp)丝氨酸(Ser)苏氨酸(Thr)那么上述序列可以转写为:ASNLEUTYRILEGLNTRPLEULYSASPGLYGLYPROSERSER
8、GLYARGPROPROPROSER但是这还没有结束,LEaP不能自动识别序列的两端,所以我们必须手工为这个序列标定N末端和C末端,标定的方法就是在N末端氨基酸前方加上N,C末端氨基酸前方加上字母C。最终在LEaP中使用的序列如下:NASNLEUTYRILEGL
此文档下载收益归作者所有