生物信息学实验指导—实验三

生物信息学实验指导—实验三

ID:28473132

大小:52.00 KB

页数:3页

时间:2018-12-10

生物信息学实验指导—实验三_第1页
生物信息学实验指导—实验三_第2页
生物信息学实验指导—实验三_第3页
资源描述:

《生物信息学实验指导—实验三》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、实验三核酸序列分析【实验目的】1、掌握已知或未知序列接受号的核酸序列检索的基本步骤;2、掌握使用BioEdit软件进行核酸序列的基木分析;3、熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析);4、了解基因的电子表达谱分析;5、熟悉密码子偏好性分析。【实验原理】针对核酸序列的分析就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。一般而言,在重复片段频繁出现的区域里,基因编码区和凋控区不太可能出现;如果某段DNA片段的

2、假想产物与某个已知的蛋白质或其它基因的产物具冇较高序列相似性的话,那么这个DNA片段就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的冇力证据;其它的证据包拈与“模板”序列的模式相匹配、简单序列模式如TATABox等和匹配等。一般而言,确定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则:对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出來并除去;选用预测程序时耍注意程序的物种特异性;耍弄清程序适用的是基因组序列还是cDNA

3、序列;很多程序对序列长度也冇要求,冇的程序只适用于长序列,而对EST这类残缺的序列则不适用。1.重复序列分析对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单的大量的重复序列标记出來并除去,因为很多情况卜重复序列会对预测程序产生很大的扰乱,尤其是涉及数据库搜索的程序。2.数据库搜索把未知核酸序列作为查询序列,在数据厍里搜索与之相似的已奋序列是序列分析预测的有效手段。在理论课中已经专门介绍了序列比对和搜索的原理和技术。但值得注意的是,由相似性分析作出的结论可能导致错误的流传;宥一定比例的序列很难在数据库里找到合适的同源伙伴

4、。对于EST序列KU言,序列搜索将是非常有效的预测手段。3.编码区统计特性分析统计获得的经验说明,DNA中密码子的使用频率不是平均分布的,某些密码子会以较高的频率使用而另一些则较少出现。这样就使得编码区的序列呈现出可察觉的统计特异性,即所谓的“密码子偏好性”。利用这一特性对未知序列进行统计学分析可以发现编码区的飢略位置。这一类技术包拈:双密码子计数(统计连续两个密码子的出现频率);核苷酸周期性分析(分析同一个核苷酸在3,6,9,...位置上周期性出现的规律h均一/复杂性分析(长聚物的统计计数);开放可读框架分析等。4.启动子分析

5、启动子是基因表达所必需的重要序列信号,识别出启动子对于基因辨识十分重要。有一些程序根据实验获得的转录因子结合特性来描述扃动子的序列特征,并依次作为启动子预测的依据,但实际的效來并不十分理想,遗漏和假阳性都比较严重。总的来说,启动子仍是值得继续研究探索的难题。1.内含子/外妞子剪接位点剪接位点一般具有较明显的序列特征,但是要注意可变剪接的问题。由于可变剪接在数据库里的注释非常不完整,因此很难评估剪接位点识别程序预测剪接位点的敏感性和精度。如來把剪接位点和两侧的编码特性结合起來分析则宵助丁提供剪接位点的识别效果。2.翻译起始位点对于

6、真核生物,如果已知转录起始点,并且没有内含子打断5’非翻译区的话,“Kozak规则”可以在人多数情况下定位起始密码子。原核生物-•般没冇剪接过程,但在幵放阅读框中找I卜:确的起始密码子仍很困难。这时由于多顺反操纵子的存在,启动子定位不象在真核生物屮起关键作用。对于原核生物,关键是核糖体结合点的定位,可以由多个程序提供解决方案。7翻译终止信号PolyA和^译终止信号不象起始信号那么重要,但也可以辅助划分基因的范闹。8.其它综合基因预测工具除了上面提到的程序之外,还有许多用于基因预测的工具,它们大多把各个方面的分析综合起来,对基因进

7、行整体的分析和预测。多种信息的综合分析奋助于提高预测的町靠性,但也冇一些局限:物种适用范围的局限;对多基因或部分基因,宥的预测出的基因结构不可靠;预测的精度对许多新发现基因比较低;对序列屮的错误很敏感:对可变剪接、重叠基因和扁动子等复杂基因语法效果不佳。9.tRNA基因识别tRNA基因识别比编码蛋白质的基因识别简单,口前基木已经解决了用理论方法预测tRNA基因的问题。tRNAscan-SE工具中综合了多个识别和分析程序,通过分析启动子元件的保守序列模式、tRNA二级结构的分析、转录控制元件分析和除去绝大多数假阳性的筛选过程,据称

8、能识别99%的真tRNA基因。【实验内容】1、使用NCBI或EMBL数据库查询系统检索人瘦素(leptin)的mRNA、基因组DNA、外显子和5”凋控区(promoter)等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义;2、使用NCBI查询系统进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。