基于predictprotein平台蛋白质结构预测

基于predictprotein平台蛋白质结构预测

ID:28025025

大小:50.28 KB

页数:7页

时间:2018-12-07

基于predictprotein平台蛋白质结构预测_第1页
基于predictprotein平台蛋白质结构预测_第2页
基于predictprotein平台蛋白质结构预测_第3页
基于predictprotein平台蛋白质结构预测_第4页
基于predictprotein平台蛋白质结构预测_第5页
资源描述:

《基于predictprotein平台蛋白质结构预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于predictprotein平台蛋白质结构预测摘要:基于predictprotein平台,通过整合threader、ROSETTA和ZDOCK等关于大分子建模的免费软件包,构建了蛋白质结构预测虚拟机,并对不能进行同源建模的BmKAP蛋白质序列的二级结构和三维结构分别进行了初步预测。关键词:蛋白质结构预测;ROSETTA;虚拟机中图分类号:Q518随着DNA和蛋白质测序速度的加快,蛋白质结构需求的日益增多,人们迫切需要一种不依赖于传统物理化学方法能够准确预测出蛋白质结构的方法[1,2]。因此,基于已有的蛋白质结构数据库,利用同源建模和计算化学的方法进行蛋白质结构预测显得日益重要。在蛋白

2、质二级结构预测中以神经网络方法为主[3,4],其中被称为PHD的神经网络预测方法整合了多种神经网络方法的优点,具有较高的准确性[5]。蛋白质三级(或三维)结构的预测方法则主要分为三种:同源性(homology)、从头计算(abinitio)和穿线法(threading)等方法[6],其中模板库中已有相似序列的同源性预测方法准确性最高。进入21世纪以后,数据整合与软件集成已经成为目前生物信息学的研究热点和重要方向[7,8]。集成整合Linux操作系统及其平台上众多的生物信息学免费软件,建立基于个人电脑或局域网服务器的生物信息学平台,是目前国内外大学或研究机构生命科学教学和科研过程中普遍采用

3、的一个策略[8]。被称为蛋白质结构预测标准的predictprotein平台[9]就是由美国哥伦比亚大学生物信息中心整合开发的基于Ubuntu/Linux系统的蛋白质二级结构预测平台。而ROSETTA是进行大分子建模、三维结构从头预测和蛋白质相互作用与对接研究的免费软件包,并自1998年以来一直在CASP(CriticalAssessmentofStructurePrediction)竞赛中居于领先地位。本文集成整合了蛋白质二级结构预测平台predictprotein平台和ROSETTA等蛋白质三维结构从头预测软件包,并对不能进行同源建模的BmKAP蛋白质序列的二级结构和三维结构分别进行

4、了初步预测。1软件与方法1.1计算机硬件本研究所需计算机硬件的最低要求如下:CPU处理器主频2GHz以上(如果在虚拟机上运行,则要求CPU支持虚拟技术),最小分配内存4GB,硬盘容量大于100GB。1.2主要软件包的获取与安装本研究所需要的各个软件下载地址如表1所示。用户可以在Windows平台上安装VirtualBox虚拟机,在虚拟机中装载bio-linux系统(iso文件),然后在该系统中挂载PredictProteinMachineImage(PPMI)数据库;也可以将下载的iso文件刻录成光盘或制作成USB驱动盘,再独立安装在计算机中。具体安装使用方法见bio-lirmx网站的使

5、用手册。表1中threader,PROSPECT、ROSETTA、VMD和ZDOCK等软件是用来预测蛋白质三维结构、分子动力学模拟和分子对接等,弥补了predictprotein平台在蛋白质三维结构预测(特别是从头计算)方面的不足。ROSETTA等软件包下载解压后,可以参照README等类似说明文件进行安装。如ROSETTA软件的安装,在LINUX终端解压后进入安装目录,执行sconsbinmode=release命令即可。2利用本平台的预测结果2.1蛋白质二级结构预测这里以东亚钳蝎蝎毒BmKAP蛋白质序列[10]为例,简要说明一下蛋白质结构预测的过程和方法。该序列是一段长度89(MKF

6、VFASFALFVIFLCFSQSLSQSYFRCRDNEVFDNCISNCGPPRCSNILNTYPCTNLGPLCTPGCKCKDGRVYDNQGRCVLQTECFQK)。在LINUX命令行终端输入“profBmKAP.fasta”,预测的结果为(LEEEEHHHHHHEEEEEELLLLLLLLEEELLLHHHHHHHLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLEEELLLLEEEEEEEEEEL)其中H表示螺旋,E表示3折叠,L表示无规则卷,可以看出该蛋白质中a螺旋有13个,0折叠有26个,无规则卷曲有50此外,predictprotein平台中还有许多与

7、蛋白质二级结构预测相关的命令,如coils(识别卷曲螺旋)、conformational(识别二级结构中构型变化的氨基酸)、disulfinder(识别序列中的二硫键)、norsp(识别序列中的非常规二级结构)、predictnls(识别序列中的核定位信号)、profdisis(识别蛋白质和DNA间的交联位点)、profisis(识别蛋白质与蛋白质间的交联位点)、phd(识别膜蛋白跨膜螺旋)等等。其预测结果表明:BmKAP是一个非球

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。