7核酸结构预测new

7核酸结构预测new

ID:34469541

大小:2.29 MB

页数:128页

时间:2019-03-06

7核酸结构预测new_第1页
7核酸结构预测new_第2页
7核酸结构预测new_第3页
7核酸结构预测new_第4页
7核酸结构预测new_第5页
资源描述:

《7核酸结构预测new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七章核酸结构分析主要内容•第一节核酸序列中的基因预测•第二节RNA二级结构预测第一节核酸序列中的基因预测•人们获得各种核酸和蛋白质序列的目的是了解这个序列在生物体中充当了怎样的功能角色。•多种角色:DNA序列中重复片段、编码区、启动子、内含子/外显子、转录调控因子结合位点等信息;蛋白质的分子量、等电点、二级结构、三级结构、四级结构、膜蛋白的跨膜区段、酶的活性位点、以及蛋白质之间相互作用等结构和功能信息。•虽然用实验的方法是多年以来解决这类问题的主要途径,但新的思路是利用已有的对生物大分子结构和功能特性的认识,用生物信息学的方法通过计算机模拟和

2、计算来“预测”出这些信息或提供与之相关的辅助信息。•鉴于生物信息学的特点,可以用较低的成本和较快的时间就能获得可靠的结果。•近10年来生物学序列信息的爆炸性增长大大促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息。•要注意的是,尽管各种预测方法都基于现有的生物学数据和已有的生物学知识,但在不同模型或算法基础上建立的不同分析程序有其一定的适用范围和相应的限制条件。•因此最好对同一个生物学问题尽量多用几种分析程序,综合分析各种方法得到的结果和结果的可靠性。•此外,生物信息学的分析只是为生物学研究提供参考,这些

3、信息能提高研究的效率或提供研究的思路,但很多问题还需要通过实验的方法得到验证。一、针对核酸序列的基因预测方法(一)如何进行基因预测•针对核酸序列的基因预测就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。•在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。了解DNA序列的一些预测原则•在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;•如果某段DNA片段的假想产物与某个已知的蛋白质或其它基因的产物具有较高序列相似性的话,那么这个DNA片段就非常可能属于外显子片段;•在一段DNA序列上出

4、现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的有力证据;•其它的证据包括与“模板”序列的模式相匹配、简单序列模式如TATABox等相匹配等。在预测一个基因结构时,还应注意以下情况:①对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除去;②选用预测程序时要注意程序的物种特异性;③要弄清程序适用的是基因组序列还是cDNA序列;④很多程序对序列长度也有要求,有的程序只适用于长序列,而对EST这类残缺的序列则不适用。(二)、重复序列分析•对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单

5、的大量的重复序列标记出来并除去,因为很多情况下重复序列会对预测程序产生很大的干扰,尤其是涉及数据库搜索的程序。常见的重复序列分析程序有GrailEXP等,可以在Web界面上使用这些程序,或者用Email来进行。GrailEXP(http://compbio.ornl.gov/grailexp/)(三)、数据库搜索•统计获得的经验说明,DNA中密码子的使用频率不是平均分布的,某些密码子会以较高的频率使用而另一些则较少出现。这样就使得编码区的序列呈现出可察觉的统计特异性,即所谓的“密码子偏好性”。利用这一特性对未知序列进行统计学分析可以发现编码区的

6、粗略位置。可利用的编码区统计特异性技术包括:•双密码子计数(统计连续两个密码子的出现频率);•核苷酸周期性分析(分析同一个核苷酸在3,6,9,...位置上周期性出现的规律);•均一/复杂性分析(长同聚物的统计计数);•开放阅读框(OpenReadingFrame,ORF)分析等。•常见的编码区统计特异性分析工具将多种统计分析技术组合起来,给出对编码区的综合判别。著名的程序有GrailEXP和GeneMark等,它们都提供了基于Web的服务。GeneMark(http://exon.gatech.edu/GeneMark/)(四)、启动子分析•启

7、动子是基因表达所必需的重要序列信号,识别出启动子对于基因辨识十分重要。•有一些程序根据实验获得的转录因子结合特性来描述启动子的序列特征,并依次作为启动子预测的依据,但实际的效果并不十分理想,遗漏和假阳性都比较严重。总的来说,启动子仍是值得继续研究探索的难题。(五)、内含子/外显子剪接位点•剪接位点一般具有较明显的序列特征,但是要注意可变剪接的问题。由于可变剪接在数据库里的注释非常不完整,因此很难评估剪接位点识别程序预测剪接位点的敏感性和精度。如果把剪接位点和两侧的编码特性结合起来分析则有助于提供剪接位点的识别效果。(六)、翻译起始位点和终止信号

8、•对于真核生物,如果已知转录起始点,并且没有内含子打断5’非编码区的话,可以在大多数情况下定位起始密码子。•原核生物一般没有剪接过程,但在开放阅读框中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。