结构基因组学课件.ppt

结构基因组学课件.ppt

ID:57290059

大小:7.90 MB

页数:65页

时间:2020-08-10

结构基因组学课件.ppt_第1页
结构基因组学课件.ppt_第2页
结构基因组学课件.ppt_第3页
结构基因组学课件.ppt_第4页
结构基因组学课件.ppt_第5页
资源描述:

《结构基因组学课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章基因组序列注释完成基因组测序仅仅是基因组计划的第一步,更大的挑战在于弄清:基因组序列中所包含的全部遗传信息是什么;基因组作为一个整体如何行使其功能。这两项任务都必须依赖于对基因组序列的正确注释(annotation)。基因组注释方法:①自动注释:依据某些规则进行数据分析得出是否为基因的结论。②人工注释:人为检测评价自动注释的结果并根据其他数据进行分析与校正。③实验注释:根据实验结果进行检测,如EST或全长cDNA。自动注释的内容:依据基因结构的特点采用软件预测,不依赖已有的表达序列;同源性比较,

2、在同一物种或不同物种中查找已有的基因序列;功能域(domain)或基序(motif)分析。基因序列注释基因功能注释5’非翻译区3’非翻译区5.1搜寻基因5.1.1根据基因结构特征搜寻基因基因(gene)Ⅰ.开放读码框在DNA链上,由蛋白质合成的起始密码子开始,到终止密码子为止的一个连续编码序列称为一个开放读码框(openreadingframe,ORF)。读码框(readingframe)任意一段DNA序列都有6种可能的读码框。终止密码子:TAA,TAG,TGAGC%=50%,终止密码子每64bp出现

3、一次;GC%>50%,终止密码子每100~200bp出现一次;由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子。ORF的长度:最长ORF法在细菌基因组中,蛋白质编码基因从起始密码子ATG到终止密码子平均有100bp,而300bp长度以上的ORF平均每36Kb才出现一次,所以只要找出序列中最长的ORF(>300bp)就能相当准确地预测出基因。在真核生物中,存在大量非编码序列和内含子,ORF阅读比较复杂。全长cDNA的编码区一般也可以用最长ORF法,如水稻的3万多条的

4、全长cDNA的编码区预测,有时例外。全长cDNA的编码蛋白序列应为4-029B,而非最长的4-029A。Ⅱ起始密码子ATG第一个ATG的确定依据Kozak规则。Kozak是一个女科学家,她研究过起始密码子ATG周边碱基定点突变后对转录和翻译所造成的影响,并总结出在真核生物中,起始密码子两端序列为:——G/N-C/N-C/N-ANNATGG——,如GCCACCATGG、GCCATGATGG时,转录和翻译效率最高,特别是-3位的A对翻译效率非常重要。该序列被后人称为Kozak序列,并被应用于表达载体的构建

5、中。若将第一个ATG中的碱基A、T、G分别标为1、2、3位,则Kozak规则可描述如下:(1)第4位的偏好碱基为G;(2)ATG的5’端约15bp范围的侧翼序列内不含碱基T;(3)在-3,-6和-9位置,G是偏好碱基;(4)除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。Kozak规则是基于已知数据的统计结果,不见得必须全部满足,一般来说,满足前两项即可。Kozak规则的内容:Ⅲ密码子偏爱性(codonbias)编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。不同种属间

6、使用同义密码的频率有很大差异:如人类基因中,丙氨酸(Ale)密码子多为GCA、GCC或GCT,而GCG很少使用。几乎所有基因(或操纵子)都有上游调控序列,它们可与DNA结合蛋白作用,控制基因表达,如启动子序列。生物的基因组特有组成也可作为判别依据,如几乎所有的管家基因(House-Keepinggene)及约占40%的组织特异性基因的5’末端含有CpG岛。在大规模DNA测序计划中,每发现一个CpG岛,则预示可能在此存在基因。Ⅳ上游控制顺序Chambon等发现内含子特点:(1)内含子连接点具有很短的保守

7、序列,称为边界顺序。其规律称为GT-AG法则(GT-AGrule)或Chambon法则。。Ⅴ外显子与内含子边界左(5')位点右(3')位点外显子A64G73G100T100A62AG8G84T63…12PyNC65A100G100N外显子内含子内含子和外显子的交界顺序GT-AG法则(仿B.Lewin:《GENES》Ⅵ,1997,Fig30.3)P314OHGAG外显子1外显子2OH外显子1UGOAG外显子1外显子2核RNA的剪接反应(仿B.Lewin:《GENES》Ⅵ,1997,Fig30.5)(2)

8、分枝点顺序:为Py80NPy87Pu75APy95,其中A为百分之百的保守,且具有2’-OH。(3)内含子5’端有一保守序列可以和U1snRNA的5’端的保守顺序互补。3’端的确认主要根据Poly(A)尾序列,若测试序列不含Poly(A),则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断。Ⅵ3’端的确认转录起始延伸5’帽子AAUAAA剪切Poly(A)聚合酶5’帽子AAUAAAAnmRNA3’端加Poly(A)尾巴由于内含子的进化没有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。