基因组学和蛋白质组学工具

基因组学和蛋白质组学工具

ID:43767920

大小:1.06 MB

页数:19页

时间:2019-10-14

基因组学和蛋白质组学工具_第1页
基因组学和蛋白质组学工具_第2页
基因组学和蛋白质组学工具_第3页
基因组学和蛋白质组学工具_第4页
基因组学和蛋白质组学工具_第5页
资源描述:

《基因组学和蛋白质组学工具》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基因组学和蛋白质组学工具本科08级通信工程1班况玲主要内容一、序列组装二、功能基因组学三、蛋白质组学一、序列组装研究内容:1、怎样将散的序列拼接起来2、如何去掉序列中重复的部分1、怎样将散的序列拼接起来我们知道,使用鸟枪法的DNA测序提供了成千上百万个小序列,每一个片段长度有400~500个碱基对。当基因组被提取成限制性片段时,它只是被部分提取。用于DNA样品的限制性酶数量只能够切开50%的酶切位点。这就意味着有些片段会跨过某个特殊的限制性位点,而另一些片段会在那个特定位点切开,而跨过其他的限制性位点。因此,这些限制性片段组成的克隆库会包含重叠片段。这些重叠片段正是序列拼接的基础。

2、1、怎样将散的序列拼接起来在得到了每个片段的序列后,序列拼接(sequenceassembly)的任务就利用这些片段间的重叠,将它们拼接成原来的序列。拼接的关键问题是得到每个片段在一个长序列中的位置信息,这种组合的集合称为contig(contiguoussegment)。序列拼接问题可以抽象为最短超序列问题(ShortestSuperstringProblem,SSP)。假设一个序列片段集合A={a1,a2,⋯,an},我们希望发现一个最短的序列S,A中所有的片段都是S的子序列。例如有序列集合:{000,001,010,011,100,101,110,101,111},包括集合中

3、所有序列的最短超序列是:0001110100。1、怎样将散的序列拼接起来直接鸟枪法序列拼接:从已测序的小片段中寻找彼此重叠的测序克隆,依次向两侧邻接的序列延伸,组装成一个完整的基因组。不需预先了解任何基因组的情况,即使缺少遗传图或物理图也可完成整个基因组顺序组装。优点:最大优点是经济、快速、高效。缺点:“鸟枪法”对高性能计算的方法和设备要求非常高,且无法测到人类基因组中重复出现的DNA片段,这些片段占到基因组的3%至5%,对于理解遗传性疾病具有重要意义。1、怎样将散的序列拼接起来Phrap算法序列拼接:1、找出序列片段间的重叠信息。2、将存在有重叠的片段组合起来,形成一个conti

4、g结构。3、形成Consensus序列(Consensus)。优点:精确度较高。缺点:运算时间较长且对存储空间的需求较大。2、如何去掉序列中重复的部分重复片段是指在目标片段中多次出现的片段。对于小规模的拼接工作例如细菌的基因组(重复序列约占全序列的1.5%)和果蝇基因组(约占全序列的3%)等,问题不明显,然而,人类基因组中含有50%以上的重复序列,这就对基因组测序产生了很大的困难。目前已经出现的很多用于shotgun片段拼接的工具,在处理重复片段时,都是采用对大量的片段数据进行反复迭代的方法,此间还需要加入很多人工的经验分析和干预。一定程度上增加了拼接所花费的时间,降低了机器的使用

5、效率。所以,在使用过程中,我们应该选择可以屏蔽重复片段的拼接算法。2、如何去掉序列中重复的部分基于特征子串的重复片段屏蔽方法:DNA序列和每一个片段序列都可以看做是字符集{A,C,T,G}上的字符串,每个长为k的字符串称为k-串;若它是某个片段(或序列)的一部分,则称它为此片段(或序列)的k-子串.特征子串:当一个k-子串为某个片段的标识性信息时,称该k-子串为该片段的特征子串。PL条件:两片段含有至少一个公共的特征子串,称之满足可能相邻(PL)条件。经计算,k需满足条件:其中n为要拼接片段的总数。2、如何去掉序列中重复的部分算法原理:即使两个本不相邻的片段因为重复片段的原因存在很

6、长的重叠,但只要它们的特征子串均不相同,处理时就不会对它们进行比对,也就不会认为它们是相邻的。这样就达到了“屏蔽”重复片段干扰的目的,也为后续的拼接产生了有用的依据。二、功能基因组学(functionalgenomics)功能基因组学的概念:功能基因组学(Functuionalgenomics)又往往被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。功能基因组在评估和检测新药时十分有用。二、功能基因组学(

7、functionalgenomics)DNA微阵列——功能基因组中的新兴技术DNA微阵列(DNAmicroarray)又称DNA阵列或DNA芯片,比较通俗的名字是基因芯片(genechip)。是一块带有DNA微阵列(micorarray)涂层的特殊玻璃片,在数平方厘米之面积上安装数千或数万个核酸探针,经由一次测验,即可提供大量基因序列相关资讯。它是基因组学和遗传学研究的工具。研究人员应用基因芯片就可以在同一时间定量的分析大量(成千上万个)的基因达的水平,具有快速、精确

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。