欢迎来到天天文库
浏览记录
ID:12983731
大小:1.26 MB
页数:68页
时间:2018-07-20
《从质谱数据鉴定多肽╱蛋白质》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三讲从质谱数据鉴定多肽/蛋白质中科院自动化所李伏欣开场白在之前的讲座中,我们已经学到了关于蛋白质组学中的重要工具—质谱仪的知识。蛋白质组学里,质谱仪的作用是鉴定混合物中的蛋白质。然而,没有数据分析的辅助,它是做不到这一点的。蛋白质鉴定的全流程Sample?PurificationDigestionMassMeasurerManySpectraSerumAlbuminMyosinCytochromeCEscheriaColi….?Identification讲座大纲本讲座中,将分别讲述两种鉴定蛋白质的方法。其一是质量纹鉴定法(PeptideMassFingerprinting),
2、另外一种是二级质谱的数据库搜索鉴定法(MS/MSDatabaseSearching)。我们将简略的介绍质量纹鉴定法。而用更多的时间讨论用于二级质谱上的方法。多肽质量纹鉴定多肽质量纹(PeptideMassFingerprinting,PMF)是从一级质谱(MS)中鉴定多肽的主要方法。多肽质量纹一般都是在MALDI-TOF仪器的结果上进行。其原理就是利用了蛋白序列数据库中的多肽质量的信息。我们下面的讨论,先假设一张质谱图对应一个蛋白。后面会讨论处理多个蛋白的情况。一级质谱图蛋白质经过酶解后,送入质谱仪,得到一级质谱。目前来说,由MALDI-TOF质谱仪产生的质谱图精度较高,而由ESI质
3、谱仪产生的质谱图精度相对较低。另一个问题是,ESI产生的质谱图中的离子通常带有很多电荷,而MALDI质谱图中的离子一般只带一个电荷,比较容易计算。所以从一级质谱鉴定蛋白质的算法(质量纹)主要用在MALDI-TOF产生的质谱图上。SampleMSSpectrum蛋白序列数据库在美国国家生物信息中心的网站http://ncbi.nlm.nih.gov上可以查询到最新的蛋白序列数据库。NCBI上的数据库中,信息最丰富的是Genpept格式,包括有蛋白的序列,各种性质,甚至于参考文献。但是对我们来说,我们只需要蛋白序列的信息就够了。Genpept示例Genpept示例FASTA格式FASTA
4、格式就是蛋白的氨基酸序列。虚拟酶解对应于送进质谱仪的样品,我们可以对数据库里的序列作一次虚拟的酶解。质量排列虚拟酶解的结果,产生了一系列的多肽,我们可以计算每个多肽的质量。最后一个R的质量多加了18,这是因为我们写在下面的是残基的分子量。质量排列的把所有多肽的质量排序。质量纹如此,质谱图上的质量就可以与多肽上的质量相匹配。质量纹这就是多肽质量纹(PMF)的最基础的思路。但是,真正的将之作为一个鉴定蛋白质的方法,还有很多需要考虑的问题。在讨论这些问题之前,我们先看一看目前常用的质量纹算法。常用的质量纹算法现在试验中可用的算法有:Mascot:http://www.matrixscien
5、ce.comProfound:http://prowl.rockefeller.edu/cgi-bin/ProfoundExpasytools:http://www.expasy.ch/tools/PeptideSearch:http://mac-mann6.embl-heidelberg.dePMF中的问题第一个问题:质量相近的多肽怎么处理?在现实的蛋白数据库中,多肽的数量是很庞大的。这里面难保不会有质量非常相近的多肽。这样,就造成了质谱图上的一个峰可能匹配不止一个多肽,于是我们就难以知晓这张质谱图究竟代表哪个蛋白。质量相近的多肽多肽[M+H+]DGAPLESSSR1019.049
6、0REGESTPSR1019.0520DFPIANGER1019.0940DPLASSSWR1019.0940YVPLKDQR1019.1800HLQLPAPSR1019.1830VLFLNGIDK1019.2200Peakm/z:1019.08解决方案第一个解决的办法是限制用来搜索的数据库。比如,你如果做的试验用的是小白鼠的组织,那么你可以只在鼠类的数据库中搜索,这样就可以减低出现这种情况的可能性。第二个解决的办法是要求必须有多个多肽和数据库相匹配,才做出最后的蛋白质鉴定。多匹配DFPIANGER1019.09EPISVSSQQMLK1347.56VLDALDSIK974.13Ca
7、rbonicanhydraseIISHHWGYGKHBGPZHWHKDFPIANGERQSPVNIDTKAVVQDPALKPLALVYGEATSRRMVNNGHSFNVEYDDSQDKAVLKDGPLTGTYRLVQFHFHWGSSBBQGSEHTVDRKKYAAELHLVHWNTKYGDFGTAAQQPDGLAVVGVFLKVGDANPALQKVLDALDSIKTKGKSTDFPNFDPGSLLPNVLDYWTYPGSLTTPPLLESVTWIVLKEP
此文档下载收益归作者所有