欢迎来到天天文库
浏览记录
ID:39130384
大小:3.87 MB
页数:75页
时间:2019-06-25
《《解读基因组序列》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、5.1在基因序列中定位基因5解读基因组序列基因测序的后续工作弄清楚:1.基因组顺序中所包含的全部遗传信息是什么(查找基因)2.基因组作为一个整体如何行使其功能基因定位的两种常见方法:其一,根据已知的序列人工判读或计算机分析寻找与基因有关的序列(如:序列筛查定位基因)其二,实验研究,看其能否表达基因产物及其对表型的影响,既实验分析5.1.1通过序列筛查定位基因细菌DNA的简单ORF扫描高等真核生物DNA的ORF扫描功能性RNA定位基因同源性搜索和比较基因组学自动标注基因组序列基因可读框ORF所有编码蛋白质的基因含有可读框(openreadingframesORF):是由可编码氨基酸的密码子组成O
2、RF起始于起始密码子(一般是ATG)终止于终止密码子(TAA,TAG,TGA)每个DNA序列有6种可读框蛋白质编码基因是三联密码子的可读框双链DNA分子具有6个可读框寻找ORF(ORFscanning)如果DNA序列CG碱基含量占50%则TAA,TAG,TGA每一个将平均每64bp出现一次如果GC含量大于50%那么含A和T碱基的终止密码子出现的频率会相对比较少,但是预期每100—200bp还会出现一次寻找ORF的方式是将100个密码子作为一个基因长度的下限简单的ORF扫描细菌DNA简单的ORF应用于细菌DNA序列的扫描可以成功的定位大多数基因,因为细菌基因间距非常小重叠基因较少,而且细菌基因内
3、无内含子,ORF连续。单核李氏杆菌溶血素gln基因基因无内含子ORF连续高等真核生物DNA的ORF扫描高等真核生物基因之间间隔太大发现家ORF的概率增加高等真核生物基因内有内含子导致ORF不连续,外显子小于100个密码子因此高等真核生物基因不会以长ORF形式出现在基因组序列中,ORF无法扫描内含子使ORF扫描复杂化河豚鱼AF164138序列某段基因分析内含子的基因图ORF扫描的三项改良密码子偏倚:特定生物体的基因中并不是所有密码子使用频率都相等,真正外显子有所偏倚。外显子——内含子边界:因为有特定的序列特征而区分开上游调控序列:调控序列有明显特点,可用来定位基因起始区外显子——内含子边界依据某
4、种生物体的DNA特征进行具体分析:如脊椎动物基因组包含着许多基因上游都有的CpG(CpGisland)岛功能性RNA定位基因搜寻编码RNA二级结构的特征碱基序列搜寻DNA编码茎环或发夹结构的程序搜索与功能RNA基因相关的调控序列搜寻紧凑的较小基因组中蛋白质编码基因间的空位置tRNA三叶草结构一个大肠杆菌tRNA基因的序列茎环结构同源性搜索和比较基因组学同源性搜索:查询DNA数据库来判断所检测序列是否与已知基因的序列相同或者是相似比较基因组学:当相关基因组进行比较时,同源基因由于它们的序列相似性很高就容易被鉴别出来,而在第二个基因组中没有明确同源物的任何ORF都可以很肯定的认为不是基因相关物种的
5、相似基因组用同线性比较检测短ORF真实性自动标注基因组序列计算机方法从序列分析开始,运用能扫描ORF、外显子-内含子边界及上游调控区并能在数据库中检测同源基因ORF的程序进行序列分析。这些程序同时也用于寻找重复序列及功能RNA基因的特意性特征,而后信息整合分析。5.1.2.基因定位的实验技术大多数基因定位的试验方法依赖于检测由基因转录成的RNA分子。杂交试验可以判断某一片段是否含有转录序列cDNA测序有助于在DNA片段中进行基因作图精确定位转录物末端可以准确定位外显子——内含子边界杂交实验判断转录序列如果用标记的基因组片段与细胞RNA进行northern杂交,就可以检测到那个片段上的基因所转录
6、出的RNA。缺点:一些单个基因有两个或更多长度不等的转录物mRNA表达时期和部位的特异性northern印迹杂交种属间印迹cDNA测序有助DNA片段基因作图将cDNA序列与基因组DNA序列相比较,就可以描述相应基因的位置找到外显子——内含子的边界,两个决定此方法成功的因素:所研究基因DNA片段表达水平的高低cDNA分子的完整性cDNA合成精确定位转录物末端将RNA做起始材料进行特殊类型的PCR逆转录PCR(reversetranscriptasePCR,RT-PCR)快速扩增cDNA末端其他的转录物准确作图的方法包括异源双链分析(heteroduplexanalysis)准确定位外显子——内含
7、子边界外显子捕获(exontrapping):将一特殊类型载体导入合适的真核细胞系中。根据已知的小基因序列确定出插入的外显子其实和终止核苷酸的位置,从而准确描述外显子外显子捕获5.2确定单个基因的功能一旦一个新基因在基因组序列中获得定位,就要探索它的功能问题。大肠杆菌基因组序列中4288个蛋白质编码基因中,以前已经鉴定出的基因只有1853个(占总数的43%)。对于酿酒酵母,此数值只有30%。像基因
此文档下载收益归作者所有