《分子生物学教案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
分子生物学教案生物062009-2010-0148学时刘小烛目录1、介绍教科书、作者、引言和序论2、染色体与DNA3、生物信息传递(上)一一从DNA到RNA4、生物信息传递(下)从mRNA到蛋白质5、分子生物学研究方法6、基因的表达与调控(上)一一原核基因表达调控模式7、基因的表达与调控(下)一一真核基因表达调控一般规律8、基因组与比较基因组学注:本教案涉及内容的讲课方法及手段全部为课堂教学
1第一章教学内容:介绍教科书、作者、引言和序论(1.引言、2.分子生物学简史、3.分子生物学的研究内容、4.分子生物学展望)教学目的:介绍本书基本结构和作者并鼓励大家争做“栋梁”;了解分子生物学的发展史、现状和未来以及学生自身的时代,鼓励学生努力学习揭示生命科学规律的科学一一分子生物学。讲课具体内容*介绍教科书及作者•为什么选定此书?对现有的分子生物学书本进行了研究,较老的书把不该写的内容写进去了;有的书结构杂乱。而此书编辑脉络清晰,内容充实,具有现代气息,反映了分子生物学的主旋律,对本质一针见血,是一本很好的书。本书的基本内容适合你们。作者:对于第一作者大家可以看书,我着重介绍第二作者,他毕业于本校的前身一一北林,在秋木园上过学,后来在美国拿了博士学位,现在在美国康奈尔大学任教授,从事分子生物学工作,99年受国务院邀请,以百名在海外有成就的博士团的身份来参加建国50周年庆典。他克隆了许多有用的基因,我时他的花卉矮壮基因和调控开花时间基因很感兴趣,我和他有合作。他是从这里走出去的,希望你们之中也有人走出向他那样的高度。结构:叙述很有条理,全书共分十章,分别为:1、序论2、染色体与DNA3、生物信息传递(上)一一从DNA到RNA4、生物信息传递(下)一一从mRNA到蛋白质5、分子生物学研究方法6、基因的表达与调控(上)一一原核基因表达调控模式7、基因的表达与调控(下)一一真核基因表达调控一般规律后面三章(8、疾病与人类健康,9、基因与发育,10、基因组与比较基因组学)与林口学生关系不密切,就不分为各章进行介绍,将把一些新的热点介绍给大家。*介绍参考书苜先把这两本书推荐给大家,这是目前美国本科及研究生使用率最高的,很新的一本书。另外一本是我们实验的主要参考书。请大家注意书的特殊标记,不要读错了书。其次大体介绍分子生物学的书,图书馆及书店有许多有关方面的书,有兴趣的同学可以深学一些内容,欢迎与我探讨!前言分子生物学的核心•1953年Watson和Crick提出了DNA双螺旋模型,人们对基因理解由抽象化、概念化转为有准确的物质内容。这是分子生物学的核心。•分子生物学分化于生物化学分子生物学的分化・20世纪90年代由于学科的渗透和交叉,,TheInternationalUnionofBiochemistry”更名为'TheInternationalUnionofBiochemistryandMolecularBiology";"中国生物化学学会,,更名为,,中国生物化学与分子生物学学会”;由原来中国生物化学学会主办的《生物化学》现更名为《生命的化学》,中国生物化学与分子生物学学会还增办了《中国生物化学与分子生物学学报》、各省的也跟着更名。这时,分子生物学才真正的浮出水面,分子生物学研究的核心内容才真正的明晰起来。80年代的分子生物学:当时的分子生物学是这样叙述的:分子生物学是在分子水平上研究生物的结构、组织和功能的科学。主要涉及的内容有蛋白的结构、酶、抗体、生物膜、核酸等等。对于生化来说可以认为没有新的内容,仅为生化的一部分。分子生物学实际是核酸生物学:就在人体基因组计划开始实施的20世纪90年代,也就是“生
2化学会”更名的年代,分子生物学才从生物化学中较为清晰的分化出来:分子生物学所关心的主要是核酸在细胞生命过程中的作用,包括核酸本身的复制、保存以及基因的表达与调控规律,这门学科应该被称为核酸生物学。分子生物学名词是图省事新鲜发明的。由于言简意赅,易于接受传播,符合传媒口味,一旦炮制,不胫而走深入人心,尽管不十分贴切,这个学科名词就这样定了下来。重大事件:2003年4月14日,国际人类基因组测序组宣布:人类基因组序列图-“完成图”提前绘制成功。人类基因组计划成果可以揭示人类生命活动的奥秘。基因遗传性疾病、严重危害人类健康的易感性疾病的致病机理有望得到彻底阐明。学习目的和意义20世纪初以来,生命科学所取得的巨大成就和进步,使生物学这门学科在自然科学中的地位发生了革命性的变化。生物学革命也为物理学、数学、化学、信息科学、材料与工程科学注入了大量新鲜血液,提出了数不胜数的新问题、新概念和新思路。它在各个科学之间广泛渗透,相互交叉,相互作用,极大地推动了科学的发展。生物学已经成为带头学科。人类面临的人口膨胀、粮食短缺、环境污染、疾病猖獗、能源资源匮乏、生态平衡被破坏及生物物种消亡等一系列重大问题。为了解决这些问题以及彻底认识自己,了解自己深深地吸引着人类自身。分子生物学从分子水平深入探索生命与自然的奥秘,全面改造和改良我们的生存环境与生存质量。分子生物学作为生物学科最新兴、最具活力的科学,在推动我国科学事业的发展、推动生物工程产业的倔起、推动国民经济持续高速发展等方面均有着举足重轻的影响。落后就要挨打,就要受人宰割。没有强大的分子生物学基础研究,我们就不可能在生物工程这个21世纪的龙头产业中占有一席之地,就不可能与世界列强平等对话。知识就是力量,就是财富!谁拥有了先进的科学技术,谁就拥有了在世界上立于不败之地的法宝。一、绪论(1.引言;2.分子生物学简史;3.分子生物学的研究内容;4.分子生物学展望)1.弓I言现代生物学研究的目标是要在分子水平上掌握细胞的功能并揭示生命的本质。从20世纪40年代开始,生命科学家赢得了当代自然科学最伟大的革命的胜利,揭开生物遗传之谜。DNA的结构与功能、RNA在蛋白质合成中的功能、蛋白质的结构与功能、遗传密码及基因表达调控的本质等重要问题相继被阐明。分子水平的生物学研究,正越来越多地影响传统生物科学的各个领域。首先简单介绍有关历史背景知识和人物,包括对遗传的最基本单位一一基因化学本质的认识。1-1创世说与进化论多少年来,人们常常会反复提出下面3个与生命和一切生物学现象有关的问题:1、生命是怎样起源的?2、为什么”有其父必有其子”?3、动、植物个体是怎样从一个受精卵发育而来的?宜到19世纪初叶,这些问题大都只能从宗教或迷信的角度进行回答。西方人一宜相信基督教的宣传,相信上帝先创造了花草树木、世间万物,后来又创造了男人亚当,再从亚当身上抽出一根肋骨,这就成了女人夏娃。亚当、夏娃婚配繁衍产生了人类。1859年,伟大的英国生物学家达尔文(ChNlesDw・win)发表了著名的《物种起源》一书,确立了进化论的概念。生物进化学说,打破了上帝造人的传统观念,改变了人们对人类在整个世界中的地位的看法,极大地推动了人类思想的发展。达尔文从小热爱大自然,喜欢采集动、植物标本。他16岁到爱丁堡大学学习,在研讨拉马克的进化学说时。他觉得拉马克不信”上帝创造一切"的"创世说",却又拿不出令人信服的证据。使达尔文的思想陷于矛盾和斗争之中,他决心深入大自然去寻找答案。后来,他以自然科学家的身份,参加了历时5年的贝格尔号军舰环球旅行,他观察过火山,经历过地震,见到了各种形形色色稀奇古怪的动物和植物。他采集了大量动、植物标本
3和化石并细心地进行比较、鉴别和研究,提出并解答了一系列学术问题。他认为;大陆自古以来发生过许多次巨变,如冰川时期等,所以不可能存在亘古不变的动、植物。从贝格尔号回到英国以后,他发表了一系列论文,逐步阐述了生物进化的观点。在《物种起源》这部划时代的科学巨著中,他用大量事实证明”物竞天择,适者生存”的进化论思想。他认为世界上的一切生物都是可变的,并预言从低级到高级的变化过程中必定有过渡物种存在。他指出物种的变异是由于大自然的环境和生物群体的生存竞争造成的,彻底否定了上帝创造万物的旧思想,推翻了物种不变的神话,使生物学真正迈入实证自然科学的行列。通过记载不同动、植物的地理分布,研究近亲种族的解剖学、形态学的相似性和变异率,达尔文第一个认识到生物世界的不连续性。他提出许多环境因素,如大地变迁、特定区域内的温度、降雨量变化及气候条件改变,都会以"自然选择压力”的形式在生物体的世代遗传中体现出来。在这种"自然选择压力”之下,新物种才不断诞生。旧的、与环境不再相容的物种也不断消亡。对于每一个动、植物种群来说,因为总是有大大多于可能生存下来的个体出生,所以为生存而斗争是长期的、永久的。如果某些个体偶然获得了于自身有利的变异,就会在生与死的斗争中占同类的上风,从而生存下来。根据遗传学原理,任何生存下来的个体都倾向于扩增其经过修饰的新性状,以保持生存优势。达尔文关于生物进化的学说及其唯物主义的物种起源理论,是生物科学史上最伟大的创举之一,具有不可磨灭的贡献。为了纪念这位生物科学大师,人们把进化论称为达尔文学说”。大家要牢固地建立起唯物主义的物种起源理论观点!1•2细胞学说17世纪末叶,荷兰籍显微镜专家Leeuwenhoek制作成功了世界第一架光学显微镜。通过这装置,他看到了一系列肉眼看不到的单细胞生物。他第一个观察到精子,发现了酵母菌,描述了红细胞等等。他断定微生物不是由泥沙尘埃产生的,而是和动物一样,有完整的生活史。大约与Leeuwenhoek同时代的Hooke,第一次用"细胞”这个概念来形容组成软木的最基本单元。但是直到19世纪中叶,这一概念才正式被科学界所接受。随着显微技术、组织保存技术和超薄切片技术的不断发展,科学家发现动、植物组织都是由细胞所组成,而且细胞是可以分裂的,每一个细胞都是或曾经是一个单独的活的实体,包含有生命的全部特征。动、植物的基本单元是细胞,这是细胞学说的核心。细胞的发生和形成是生物学界普遍和永久的规律。每一个动、植物个体实际上是千千万万个生命单元的总和,而这些微小单元一一细胞,包含了所有的生命信息。细胞学说对生物科学最重要的贡献在于:因为单个细胞生长分裂,组织、器官和个体的生命现象实际上是细胞活动的总和,所以细胞可以而且应该成为生物学研究的苜要对象。1.3经典的生物化学和遗传学进化论和细胞学说相结合,产生了现代生物学;以研究动、植物遗传变异规律为目标的遗传学和以分离纯化、鉴定细胞内含物质为目标的生物化学则是这一学科的两大支柱。19世纪中叶,人们发现动物和植物细胞的提取液中主要是一些能受热或酸变性形成纤维状沉淀的物质。这些物质包含有大体相等摩尔浓度的碳、氢、氧和氮。科学家将这些物质命名为蛋白质。蛋白质是生活细胞中所有化学反应的执行者和催化剂。生物化学执行着双重使命:分析细胞的组成成分和弄清楚这些物质与细胞内生命现象的联系。19世纪中叶到20世纪初,是早期生物化学的大发展阶段,组成蛋白质的20种基本氨基酸被相继发现。著名生物化学家Fisher还论证了连接相邻氨基酸的"肽键”的形成。细胞的其他部分,如脂类、糖类和核酸也相继在那一阶段被科学家所认识和部分纯化。当时,科学家还无法解释细胞内最重要的生命活动,即细胞成分是如何世代相传的。奥地利大科学家、经典遗传学创始人孟德尔(GregorMendel)发现并提出遗传学定律的故事像是不朽的神话,在生物学界被广泛传诵。孟德尔从小爱好园艺,他对"种瓜得瓜,种豆得豆”的生物遗传现象感到好奇和困惑。他做了许多试验,例如,他用产生圆形种子的豌豆同产生皱皮种子的豌豆杂交,得到几百粒全是圆形的杂交子一代(F。种子。第二年,他种植了253粒B圆形种子并进行自交,得到7324
4粒F2种子,其中有5474粒是圆形的,1850粒是皱皮的,用统计学方法计算出圆皱比为3:1。他还进行了具有2个对立性状的豌豆品系之间的双因子杂交试验。他发现当选用产生黄色圆形种子的豌豆品系同产生绿色皱皮种子的豌豆品系进行杂交时,所产生的品种子全是黄色圆形的,但在自交产生的J代556粒种子中,不但出现了2种亲本类型,而且还出现了2种新的重组类型,其中黄色圆形315粒,黄色皱皮121粒,绿色圆形108粒,绿色皱皮32粒。这4种类型的比例接近于9:3:3:1。根据以上现象,孟德尔总结出生物遗传的两条基本规律:第一,当两种不同植物杂交时,它们的下一代可能与亲本之一完全相同。这一现象称为统一律。根据自己长期的实验结果,孟德尔认为,生物的每一种性状都是由遗传因子控制的。这些因子可以从亲代到子代,代代相传。在体细胞内,遗传因子是成对存在的。其中一个来自父本,一个来自母本。形成配子时成对的遗传因子彼此分开,单独存在。他还认为,有些遗传因子以显性(dominant)形式存在,即能在任何杂种一代中得到表达;而有些因子呈隐性(recessive)状态,只有当父、母本同时含有这一因子时,才得到表现。第二,将不同植物品种杂交后的R代种子再进行杂交或自交时,下一代就会按照一定的比例发生分离,因而具有不同的形式。他把这一现象称为分离规律。如把红花和白花杂交,得到的8株品代植株全部为灰色花,互相交配结果得到2株红花、2株白花、4株灰色花。这一代的白色花互相交配,将永远得到白色花,红色花互相交配得到的永远是红色花。但这一代的灰色花互相交配,其结果就像上一代那样,仍旧是2红、2白、4灰。所有这些花朵,都按照孟德尔的分离规律依次遗传下去。分离规律对每一代动、植物都适用。在孟德尔遗传学的基础上,美国著名的遗传学家Morgan又提出了基因学说。他的红眼果蝇和白眼果蝇的研究很有名由于一是遗传学的内容,这里不多讲。结果是,白眼隐性突变基因确实位于X染色体上。这一现象被称为遗传性状的连锁定律,又称连锁遗传。Morgan第一次将代表某一特定性状的基因,同某一特定的染色体联系起来,使科学界普遍认识了染色体的重要性并接受了孟德尔的遗传学原理.Morgan特别指出:种质必须由某些独立的要素组成,我们把这些要素称为遗传因子,或者更简单地称为基因。开始有了基因在染色体内的初步认识。到了这里我希望大家建立这样的概念:染色体好比一艘轮船,基因就是船上的一个部件。1•4•DNA的发现
51953年Watson和Crick提出了DNA双螺旋模型,从此人们对基因就有了准确的物质内容的认识。然而,在这是之前,人们对于基因的理解仍然是抽象的、概念化的,缺乏准确的物质内容;对核酸是遗传信息的载体没有认识,还以为只有像蛋白质这样复杂的大分子才可以担当决定细胞生物学特性和遗传的重托。那时的遗传学家,没有探明基因的结构特征,不能解释基因是怎样在细胞繁殖过程中准确地复制和遗传的。1928年英国科学家Griffith等人发现,肺炎链球菌使小鼠死亡的原因是引起肺炎。细菌的毒性(致病力)是由细胞表面荚膜中的多糖所决定的。具有光滑外表的S型肺炎链球菌因为带有荚膜多糖而能使小鼠发病,具有粗糙外表的R型细菌因为没有荚膜多糖而失去致病力(荚膜多糖能保护细菌免受动物白细胞的攻击)o届染小鼠S型・体死s型♦体R型・体死小鼠体内有活S型・体死S型・体活R型・体转化提取死S型♦体DNA与R型活■体混合图1-1DNA是“转化源”活S型重体苜先用实验证明基因就是DNA分子的是美国著名的微生物学家Avery。将光滑型致病菌(S型)烧煮杀灭活性以后再侵染小鼠,发现这些死细菌丧失了致病能力(图1-1)。再用活的粗糙型细菌(R型)来侵染小鼠,也不能使之发病,因为粗糙型细菌天然无致病力。然而,当他们将经烧煮杀死的S型细菌和活的R型细菌混合再感染小鼠时;奇迹发生了!实验小鼠死亡。解剖死鼠,发现有大量活的S型(而不是R型)细菌。他们推测,死细菌中的某一成分一转化源(transfermingprinciple)将无致病力的细菌转化成病原细菌。10多年后,实验表明,DNA就是转化源。死细菌的蛋白质及细胞失去生命功能,但只要死细菌的DNA不被破坏,死细菌DNA在活的R型细菌中可转化出活的S型致病菌,从而导致了小鼠死亡。这一重大发现轰动了整个生物界。改变了“只有像蛋白质这样复杂的大分子才可以担当决定细胞生物学特性和遗传的函托”的固有认识。在遗传学理论上树立了全新的观点及DNA是遗传信息的我体。美国冷泉港卡内基遗传学实验室科学家Hershey和他的学生Chase在1952年从事噬菌体侵染细菌的实验(图-2)。噬菌体专门寄生在细菌体内。它的头、尾外部都有由蛋白质组成的外壳,头内主要是DNA。噬菌体侵染细菌的过程可以分为以下5个步骤:1.噬菌体用尾部
6的末端(基片、尾丝)吸附在细菌表面⑵噬菌体通过尾轴把DNA全部注入细菌细胞内,噬菌体的蛋白质外壳则留在细胞外面;3.噬菌体的DNA一旦进入细菌体内,它就能利用细菌的生命过程合成噬菌体自身的DNA和蛋白质;4.新合成的DNA和蛋白质外壳,能组装成许许多多与亲代完全相同的子代噬菌体;5.子代噬菌体由于细菌的解体而被释放出来,再去侵染其他细菌。在这整个过程中,DNA是关键。*»«e*aaia»早早da"©,*,,,、((««••««<••a*««•<.(•«■•«■(*•••••■那么,DNA到底是什么样的呢?在1944年的研究报告中,Avery写道:当溶液中酒精的体积达到90时,有纤维状物质析出。如稍加搅动,这种物质便会像棉线绕在线轴上一样绕在硬棒上,溶液中的其他成分则以颗粒状沉淀留在下面。溶解纤维状物质并重复沉淀数次,可提高其纯度。这一物质具有很强的生物学活性,初步实验证实它很可能就是DNA(谁能想至IJ!)。对DNA分子的物理化学研究导致了现代生物学翻天覆地的革命!本节的教学目的:让学生树立唯物主义进化论观点;了解从性状到细胞再到染色体再到DNA的的历史,知道分子生物学产生的历史。2,分子生物学简史分子生物学是研究核酸、蛋白质等生物大分子的形态、结构特征及其规律性和相互关系的科学,是人类从分子水平上真正揭示生物世界的奥秘,由被动地适应自然界转向主动地改造和重组自然界的基础学科。同一生物不同世代之间的连续性是由生物体自身所携带的遗传物质所决定的。科学家为揭示这些遗传密码所进行的努力成为人类征服自然的一部分。以生物大分子为研究对象的分子生物学迅速成为现代生物学领域里最具活力的科学。从1847年Schleiden和Schwann提出"细胞学说"到证明动、植物都是由细胞组成的,短短一百多年的时间,人们对生物大分子一一细胞的化学组成已经有了深刻的认识。孟德尔的遗传学规律最先使人们对性状遗传产生了理性认识,而Morgan的基因学说则进一步将“性状”与“基因”相偶联,成为现代遗传学的奠基石。随着核酸化学研究的进展,Watson和Crick提出了脱氧核糖核酸的双螺旋模型,为充分揭示遗传信息的传递规律铺平了道路,是人类生物学研究史中最壮丽的历程碑。在蛋白质化学方面,继Sumner在1936年证实梅是蛋白质之后,Sanger利用纸电泳及层析技术于1953年苜次阐明胰岛素的一级结构,开创了蛋白质序列分析的先河。Kendrew和Perutz利用X射线衍射技术解析了肌红蛋白(myoglobin)及血红蛋白(hemoglobin)的三维结构,论证了这些蛋白质在输送分子氧过程中的特殊作用,成为研究生物大分子空间立体构型的先驱。为了解分子生物学的发展,看一看部分诺贝尔生理医学奖和化学奖获奖情况,以了解分子生物学的发展简史。
71910年,德国科学家Kossel因为蛋白质、细胞及细胞核化学的研究而获得诺贝尔生理医学桨,他首先分离出腺嚓岭、胸腺喀庭和组氨酸。1959年,美籍西班牙裔科学家Uchoa发现了细菌的多核昔酸磷酸化酶,成功地合成了核糖核酸,研究并重建了将基因内的遗传信息通过RNA中间体翻译成蛋白质的过程。他和Kornberg分享了当年的诺贝尔生理医学奖,后者的主要贡献是实现了DNA分子在细菌细胞和试管内的复制。1962年,美国科学家Watson和英国科学家Crick因为在1953年提出DNA的反向平行双螺旋模型而与Wilkins共享诺贝尔生理医学奖,后者通过对DNA分子的X射线衍射研究证实了Watson和Crick的DNA模型。同年,英国科学家Kendrew和Perutz由于测定了肌红蛋白及血红蛋白的高级结构而荣获诺贝尔化学奖。1965年,法国科学家Jacob和Monod由于提出并证实了操纵子(operon)作为调节细菌细胞代谢的分子机制而与Iwoff分享了诺贝尔生理医学奖。Jacob和Monod还首次提出mRNA。1968年,美国科学家Nirenberg由于在破译DNA遗传密码方面的贡献,与Holley和Khorana等人分享了诺贝尔生理医学奖。Holley的主要功绩在于阐明了酵母丙氨酸tRNA的核昔酸序列,并证实所有tRNA具有结构上的相似性;Khorana第一个合成了核酸分子,并且人工复制了酵母基因。1975年,美国人DulbeccoTemin和Baltimore由于发现在RNA肿瘤病毒中存在以RNA为模板,逆传录生成DNA的逆转录醐而共享诺贝尔生理医学奖。1980年,Sanger和Gilbert因设计出•种测定DNA分子内核甘酸序列的方法,与Berg分获诺贝尔化学奖。Berg是研究DNA而组技术的元老,他最4(1972)获得了含有编码哺乳动物激素基因的工程菌株。此外,Sanger还由于测定了牛胰岛素的一级结构而获得1958年诺贝尔化学奖。1984年,德国人Kohler、美国人Milstein和丹麦科学家Jerne由于发展了单克隆抗体技术,完善了极微量蛋白质的检测技术而分享了诺贝尔生理医学奖。1989年,美国科学家Altman和Cech由于发现某些RNA具仃梅的功能(称为核施)而共享诺贝尔化学奖。Bishop和Varmus由于发现正常细胞同样带有原癌基因而分享当年的诺贝尔生理医学奖。1993年,美国科学家Mullis由于发明PCR仪而与第一个设计基因定点突变的Smith共享诺贝尔化学奖。1994年,美国科学家Gilmm和Rdbell由于发现了G蛋白在细胞内信号转导中的作用而分享诺贝尔生理医学奖。1996年,澳大利亚科学家Doherty和瑞士人Zinkernagel由于阐明了T-淋巴细胞的免疫机制而分享了当年的诺贝尔生理医学奖。1999年,美国科学家Blob国由于阐述了蛋臼质在细胞间的运转机制,明确了信号肽及信号识别复合物(SRPS,signal-recognitionparticles)在蛋白质跨膜运转过程中的主导作用而获得诺贝尔生理医学奖。2000年,德国科学家Carlsson和美国人Greengard及Kandel由于在细胞内信号转导、帕金森综合症治疗、神经传导及记忆系统发育等方面的匚作而分享诺贝尔生理医学奖。2001年,美国科学家Hartwell、英国科学家Hunt和Nurse因为对细胞周期调捽因了的研究而分享诺贝尔生理医学奖。
8此外,Avery等人(1944)关于强致病性光滑型(S型)肺炎链球菌DNA导致无毒株粗糙型(R型)细菌发生遗传转化的实验并分离了DNA、Meselson和Stahl(1958)关于D\A半保留复制的实验、Crick于1954年所提出的遗传信息传递规律(即中心法则,图『3)、Yanofsky和Brener(1961)关『遗传密码一联/的设想都对分子生物学的发展起了重大作用。蛋白质生理功能图1-3遗传信息传递的中心法则20世纪60年代、70年代和80年代,我国科学家相继实现了人工全合成有生物学活性的结晶牛胰岛素。采用有机合成与酶促相结合的方法完成了酵母丙氨酸转移核糖核酸的人工全合成。在酶学研究、蛋臼质结构及生物膜结构与功能等方面都有所建树。各位把分子生物学发展的主线条串起来,得出主干认识。孟德尔一性状遗传,Morgan"性状"与"基因"相偶联,Watson和Sumner(1936)证实的是蛋白质,Avery等人(1944)(S型)肺炎链球菌DW导致(R型)细菌发生遗传转化并分离/DNA;Watson和Crick在1953年提出DNA的反向平行双螺旋模型,Crick(1954)中心法则、Meselson和Stahl(1958)DNA半保留复制、Sanger(1958)阐明胰岛素的一级结构。1959年,Uchoa发现了多核昔酸磷酸化酶,成功地合成了核糖核酸,研究并重建了将基因内的遗传信息通过RNA中间体翻译成蛋白质的过程。Kornberg实现了DNA分子在细菌细胞和试管内的复制。Yanofsky和Brener(1961)遗传密码三联子。Wilkins(1962)证实了Watson和Crick的DNA模型。1965年,Jacob和Monod提出mRNA。1968年,Nirenberg破译D\A遗传密码;Holley阐明了酵母丙氨酸tRNA的核昔酸序列,并证实所有tRNA具有结构上的相似性;Khorana第一个合成了核酸分子,并且人工复制了酵母基因。Berg(1972)获得了工程菌株。1975年,DulbeccoTemin和Baltimore发现逆转录酶。1980年,Sanger和Gilbert设计出--种测定DNA分子内核甘酸序列的方法,1993年,Mullis发明PCR仪:Smith第一个设计基因定点突变。本节教学目的:记住分子生物学发展的主要历史事件和人物,勾画出分子生物学发展时期的主线条。3、分子生物学的研究内容现代生物学研究发现,所有生物体中的有机大分子都是以碳原子为核心,并以共价键的形式与氢、氧、氮及磷构成的。一切生物体中的各类有机大分子都是由完全相同的单体组合而成的,如蛋白质分子中的20种氨基酸、DNA的4种脱氧核甘酸和RNA中的4种核甘酸,由此产生了分子生物学的3条基本原理:①构成生物体各类有机大分子的单体在不同生物中都是相同的;如构成人的DNA和小麦的DNA的4种脱氧核甘酸都是相同的ATCG,构成各种生物体的蛋白质分子中的赖氨酸都是相同的。②生物体内一切有机大分子的建成都遵循共同的规则;如老鼠和桃树以及所有生物体内的蛋白质分子都由肽键相连。③某一特定生物体所拥有的核酸及蛋白质分子决定了它的属性。核酸是遗传信息的携带者,这些信息将最终产生出蛋白质,蛋白质是功能的体现者。从表面看,分子生物学涉猎范围极为广阔,研究内容也似乎包罗万象。事实上,它所研究的仅以下四个方面:DNA重组技术;基因的复制、保存、表达和表达调控;生物大分子的结构功能;基因组、功能基因组与生物信息学。3,1DNA重组技术
9DNA重组技术是20世纪70年代初兴起的技术科学,我所在的研究室80年代初开始将烟草花叶病毒的外壳蛋白基因转入烟草,希望烟草产生抗烟草花叶病毒的能力。DNA重组技术目的是将不同的DNA片段(如某个基因或基因的•部分或几个基因)按照人们的设计定向连接起来,在特定的受体细胞中复制并得到表达,产生影响受体细胞的新的遗传性状。DNA市:组技术基本上与基因工程等同,但是严格说来,并不完全等于基因工程,因为后者还包括其他可能使生物细胞基因组结构得到改造的体系。DNA重组技术是核酸化学、蛋白质化学、酶工程及微生物学、遗传学、细胞学长期深人研究的结晶,而限制性内切酶、DNA连接酶及其他工具酶的发现与应用则是这一•技术得以建立的关键。DNA重组技术有着广阔的应用前景。首先,它可被用于大量生产某些在正常细胞代谢中产量很低的多肽,如激素、抗生素、梅类及抗体等,提高产量,降低成本,使许多有价值的多肽类物质得以服务于人类。其次,DNA重组技术可用于定向改造某些生物的基因组结构,使它们所具备的特殊经济价值或功能得以成百上千倍地提高。如2000年,我在日本理学研究实力最强的研究所一一理化学研究所所进行的研究:将三种酶有序的组装在载体上,转入烟草中,烟草就会产生一种可被生物降解的塑料一一多聚链烷酸。第三,DNA重组技术是研究分子生物学的重要手段:分子生物学研究的核心是遗传信息的传递和控制,根据中心法则,我们要研究的就是从DNA到RNA,再到蛋白质的全过程,还有基因的表达与调控。因此,无论是对启动子的研究(包括调控元件),还是对转录因子的克隆与分析,都必须使用DNA重组技术。3•2基因表达调控研究蛋白质分子参与并控制了细胞的一切代谢活动,决定蛋白质结构和合成时序的信息都由核酸(主要是脱氧核糖核酸)分子编码,表现为特定的核甘酸序列,所以基因表达实质上就是遗传信息的转录和翻译。基因表达的调控主要发生在转录水平或翻讲水平上。原核生物的基因组和染色体结构分别比真核生物简单,转录和翻译在同一时间和空间内发生,因此基因表达的调控主要发生在转录水平。真核生物有细胞核结构,转录和翻译过程在时间和空间上都被分隔开,且在转录和翻译后分别有复杂的信息加工过程,其基因表达的调控可以发生在各种不同的水平上。基因表达调控主要表现在信号转导研究、转录因子研究及RNA剪接3个方面。信号传导是指外部信号通过细胞膜上的受体蛋白传到细胞内部,并激发离子通透性、细胞形状或其他细胞功能方面的应答过程。信号传导之所以能引起细胞功能的改变,主要是由于信号最后活化了某些蛋白质分子,使之发生构型变化,从而直接作用于靶位点,打开或关闭某些基因。转录因子是一群能与基因5'端上游特定序列专一结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。真核基因在结构上的不连续性是近10年来生物学上的重大发现之一。当基因转录成pre-mRNA后,除了在5'端加帽及3'端加多聚A[Poly(A)]之外,还要切去隔开各个相邻编码区的内含子,使外显子(编码区)相连后成为成熟mRNA。研究发现,许多基因中的内含子在pre-mRNA中的片段并不是一次全部切去,而是在不同的细胞或不同的发育阶段选择性剪切其中部分内含子,生成不同的mRNA及蛋白质分子。由于RNA的选择性剪切不牵涉到遗传信息的永久性改变,所以是真核基因表达调控中一种比较灵活的方式。3•3生物大分子的结构功能研究一一结构分子生物学一个生物大分子,无论是核酸、蛋白质或多糖,在发挥生物学功能时,必须具备两个前提。首先,它拥有特定的空间结构(三维结构);其次,在它发挥生物学功能的过程中必定存在着结构和构象的变化。结构分子生物学就是研究生物大分子特定的空间结构及结构的运动变化与其生物学功能关系的科学。它包括结构的测定、结构运动变化规律的探索及结构与功能相互关系的建立3个主要研究方向。目前,最常见的研究三维结构及其运动规律的手段是x射线衍射的晶体学(又称蛋白质晶体学),其次是用二维或多维核磁共振研究液相结构。
103-4基因组、功能基因组与生物信息学研究在基因组研究方面:2001年2月,世界两大最著名的学术刊物一一Nature和Science同时发表了人类基因组全序列,为确定基因对人类生长发育和疾病的预防治疗提供了一个前所未有的大舞台,生命科学界为之振奋。现在,数十种原核生物、酵母、线虫、果蝇、老鼠、小麦、水稻和拟南芥等多种真核生物基因组被破译。功能基因组计划:完成某一生物的基因组计划就意味着该物种所有遗传密码己经为人类所掌握,但测定基因组序列只是了解基因的第•步。因为基因组计划不可能直接阐明基因的功能,更不能预测该基因所编码蛋白质的功能与活性,所以,并不能指导人们充分准确地利用这些基因的产物。于是,科学家又在基因组计划的基础上提出了"蛋白组计划"(又称"后基因组计划”或"功能基因组计划”),旨在快速、高效、大规模鉴定基因的产物和功能。生物信息学:巨大的基因组信息给科学家带来了前所未遇的挑战。以人细胞中所带有的30亿个碱基对为例,一个人即使每秒读10个碱基,每天工作24小时,一年干365天,也得花10年时间才能把这些数据看一遍,如果做数据分析,所需时间更多。没有生物信息学的知识,不借助于最先进的计算科学,人类就不可能最大限度地开发和运用基因组学所产生的庞大数据。依靠计算机快速高效运算并进行统计分类和结构功能预测的生物信息学就是在这样的背景下诞生的。4分子生物学展望从20世纪50年代初Watson和Crick提出DNA双螺旋模型至今,短短50年间,生物学领域发生了巨变。核甘酸序列测定技术的迅速进步,使人类基因组30亿个碱基时全部被测定!20年前,当人们第一次谈到这个巨大的项目时,不免带有“谈虎色变”的感觉。X射线衍射及其他高分子研究技术的相继问世,使建立生物大分子三维构象库的梦想成真,到2001年己有20000余套蛋白质构象入库;DNA重组技术的应用,使得基因克隆分析日益成为全世界数以万计生物科学工作者手中的“常规武器”,近来每年都有上千个新的基因序列被存入各类基因文库(GAFP的cDNA和蛋白序列就是由我们研究组完成并存入genbank中)。根据2000年的统计资料,全球范围内转基因植物的大田试验已超过2500次,己有200多种植物被转化成功。20世纪中期以来,生物学在各个学科之间广泛渗透,相互促进,不断深入和发展。科学家既从宏观和微观、最基本和最复杂等不同方向展开研究,也从分子水平、细胞水平、个体和群体等不同层次深人探索各种生物学现象,逐步揭开生命的奥秘。生物学革命也为数学、物理学、化学、信息科学、材料与工程科学提出了许多新概念、新问题和新思路,促使这些学科在理论和方法上得到发展提高。生命世界的多样性和生命本质的一致性这个辩证的统一,已经为越来越多的人所接受。尽管生命过程在数以万计的不同生物中的表现形式可以是完全不同的,但生命活动的本质是高度一致的,如核酸与蛋白质一级结构的对应关系,在整个生命世界都是一致的。除极少数生物体外,脱氧核糖核酸是地球上千百万生灵所共有的遗传密码。如果没有这个统一性,人们就不可能把某一个基因从A生物转移到B生物体内,使其得到表达并发挥相同的功能。从表面上看,动物和植物是两个完全不同的群体,它们以两种完全不同的方式摄取能量。动物靠的是氧化磷酸化,在食物的氧化过程中合成“生命通货”——腺甘三磷酸(ATP);而植物则通过光合作用,将光能转变成ATP,以供生命活动之需。其实,动、植物细胞代谢活动的实质都是电子在一系列受体蛋白之间传递,造成膜内外质子梯度差,以合成ATP。生命活动的这种高度一致性,使分子生物学研究日益渗透到生物学的各个领域,产生了全面的影响。分子生物学、细胞生物学和神经生物学是当代生物学研究的三大主题,分子生物学的全面渗透推动了细胞生物学和神经生物学的发展。分子生物学研究技术的发展,完全改变了科学家对膜内外信号转导、离子通道的分子结构、功能特性及运转方式的认识。遗传学是分子生物学发展以来受影响最大的学科。孟德尔著名的皱皮豌豆和圆粒豌豆子代分离实验以及由此得到的遗传规律,纷纷在近20年内得到分子水平上的解释。越来越多的
11遗传学原理正在被分子水平的实验所证实或推弃,分子遗传学已成为人类了解、阐明和改造自然界的重要武器。分类和进化研究是生物学中最古老的领域,它们同样由于分子生物学的渗透而获得了新生。过去研究分类和进化,主要依靠生物体的形态,并辅以生理特征,来探讨生物间亲缘关系的远近。现在,反映不同生命活动中更为本质的核酸、蛋白质序列间的比较,已被大量用于分类和进化的研究。由于核酸技术的进步,科学家已经可能从已灭绝的化石里提取极为微量的DNA分子,并进行深入的研究,以此确证这些生物在进化树上的地位。分子生物学还对发育生物学研究产生了巨大的影响。人们早就知道,个体生长发育所需的全部信息都是储存在DNA序列中的,如果受精卵中的遗传信息不能按照一定的时空顺序表达,个体发育规律就会被打乱,高度有序的生物世界就不复存在。分子生物学的发展揭示了生命本质的高度有序性和一致性,是人类在认识论上的重大飞跃。生命活动的一致性,决定了本世纪的生物学是真正的统一生物学(generalbiology),是生物学范围内所有学科在分子水平上的统一。由于分子生物学、生物化学及生物物理学的影响,大量物理、化学工作者进入生物学领域,既有力地推动了生命科学的发展,也极大地影响了这两个学科的发展。分子生物学不仅是目前自然科学中进展最迅速,最具活力和生气的领域,也是新世纪的带头学科。要真正学好分子生物学这门重要的实验科学,除了在书本上下功夫,理解并掌握其基本规律之外,还要善于跟踪和研究最新的科技文献,因为这些新发现、新进展往往对于解决学习中碰到的疑难问题有着举一反三、画龙点睛的作用。实验操作是掌握分子生物学精髓的主要途径,经常动手做实验或设计一些新的实验程序,往往能起到事半功倍的效果。思考题:生物科学方向的大学生了解分子生物学的必要性。第二章染色体与DNA教学内容:1染色体;2DNA的结构;3DNA的复制;4原核生物和真核生物DNA的复制特点;5DNA的修复;6DNA的重组;7DNA克隆概述教学目的:让学生了解以上教学内容。教学重点:染色体、DNA的结构和DNA的复制。难点是原核生物和真核生物DNA的复制特点、DNA的修复和DNA的重组。讲课具体内容染色体与DNA
12所行生命体都具备代代相传的本领。然而,生物遗传的物质基础是什么?或者说,决定生物遗传的因素是什么?分子生物学的研究证实,脱氧核糖核酸(DNA)控制了生物的性状遗传,也有以核糖核酸(RNA)作为遗传物质的(如部分病毒)。最新研究发现,有一类蛋白质也能控制生物的性状遗传。关于这种最新研究成果,大家有个概念就行了,不在本章的讲述内容中。本章讲的是DNA和RNA;它们都是由很多个核苜酸连接而成的生物大分子,而每个核昔酸又由磷酸、核糖和碱基3部分组成。(从化学结构水平解释以下三个图)图2-1核昔酸的组成与结构核音的5'位和3'位都可能与磷酸基团相连组成DNA分子的碱基只有4种,即腺噂吟(A),鸟噂吟(G)、胸腺啥咤(T)和胞嘴嚏(C)。下图是存在于DNA和RNA分子中的5种碱基的结构式。2.1染色体•19•嚓吟腺嚎吟鸟喋吟尿磅嚏胸I•唔嚏图2-2组成DNA和RNA分子的五种含意碱基的结构式胸腺喀咤(T)在DNA中,尿喀咤(U)在RNA中。1染色体1*1染色体概述19世纪中叶,细胞生物学家在细胞分裂时观察到存在于细胞核中的棒状可染色结构,将其命名为染色体。染色体位于真核细胞核的核仁内,是极细微的线性构造,它控制了生命遗传,称之为“生命之线”。当细胞分裂时,每一条染色体都复制生成一条与母链完全一样的子链,形成同源染色体对。
13由于亲代能够将自己的遗传物质DNA以染色体chromosome的形式传给子代,保持了物种的稳定性和连续性,因此,染色体在遗传上起着主要作用。染色体包括DNA和蛋白质两大部分。同一物种内相同染色体所带DNA的量是一定的,但不同染色体或不同物种之间变化很大,从百万到几亿个核甘酸不等。组成染色体的蛋白质(组蛋白和非组蛋白)种类和含量也是十分稳定的。由于细胞内的DNA主要在染色体上,所以说遗传物质的主要载体是染色体。真核与原核细胞染色体除了外观结构不同之外,它们在细胞内的存在方式也不同。细菌染色体外裹着稀疏的蛋白质,这些蛋白质有些与DNA的折叠有关,另一些则参与DNA复制、雨组及转录过程。真核细胞的染色体中,DNA与蛋白质完全融合在一起,其蛋白质与相应DNA的质量比约为2:1。这些蛋白质在染色体的结构中起着重要作用。DNA、组蛋白、非组蛋白及部分RNA组成了染色体。因为原核生物没有真正的细胞核,DNA一般位于一个类似"核”的结构一一称为类核体E.细菌DNA是一条相对分子质量在IO,左右的共价、闭合双链分子,通常也称为染色体。大肠杆菌一般情况下含有一条染色体。原核细胞都是单倍的。2.1金色体•21・K?>“MR染色体I0色体2・色体30色体4染色体sKK仁染色体•染色体7染色体80色体90色体10力)(人八■色体II染色体12■色体13■色体|4II事色体IS■2-3人类22对型色体及性染色体■■结构图原核生物DNA的主要特征:原核生物中-•般只有一条染色体,且大都带有单拷贝基因;整个染色体DNA几乎全部由功能基因与调控序列所组成;几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。(无内含子)1•2真核细胞染色体的组成真核细胞的染色体由DNA、组蛋白、非组蛋白及部分RNA组成,其蛋白质与相应DNA的质量比约为2:1。真核细胞有明显的核结构。体细胞的染色体是二倍体(成对的),每个基因有两个拷贝。性细胞(生殖细胞或配子)的染色体数目是体细胞的一半(对中的一条),称为单倍体,所含基因是体细胞中两个拷贝之一。来自父本和母本各带单拷贝基因的单配体配子进行细胞融合之后,创造了一个新生的二倍体。在这个新的个体内,基因的一个拷贝来自父本,另一个
14拷贝来自母本。这两个有一定差异的基因拷贝完全融合(基因重组)之后得到的两个拷贝是完全相同的,恢复体细胞“每个基因有两个完全相同拷贝”的一般状态。作为遗传物质,染色体具有如下特征:1、分子结构相对稳定;2、能够自我复制,使亲、子代之间保持连续性;3、能够指导蛋白质的合成,从而控制整个生命过程;4、能够产生遗传的变异。真核细胞染色体被大量蛋白质及核膜所包围,DNA的转录和翻译在不同的空间和时间上进行,其基因表达的调控不仅与DNA的序列有关,而且也与染色体的结构有关。下面介绍真核细胞染色体的组成。1•1蛋白质染色体上的蛋白质主要包括组蛋臼和非组蛋白。组蛋白是染色体的结构蛋白,它与DNA组成核小体。组蛋白分别为Hl、H2A、H2B、H3及H4。这些组蛋白都含有大量的赖氨酸和精氨酸。组蛋白具有如下特性:(1)进化上的极端保守性不同种生物组蛋白的氨基酸序列十分相似,特别是H3、H4。H3及H4在氨基酸组成上的极端保守性对稳定真核生物的染色体结构起市要作用。(2)无组织特异性指一切生物组织都含以上5种组蛋白,只有极少数生物例外。(3)肽链上氨基酸分布的不对称性碱性氨基酸集中分布在N端的半条链上。大部分疏水基团都分布在C端。这种不对称的分布与它们的功能和相互作用有关。碱性的半条链易与DNA的负电荷区结合(思考:为什么),而另外半条链与其他蛋白结合。(4)组蛋白被修饰包括甲基化、乙酰化及磷酸化等。(5)富含碱性氨基酸碱性的组蛋白易于与酸性的DNA相结合。(6)染色体上的组蛋白与DNA等量染色体上还存在大量的非组蛋白。非组蛋白大约占组蛋白总量的70%,它的种类约在20T00种之间,其中常见的有15—20种。非组蛋白包括酶类,收缩蛋白、骨架蛋白、肌动蛋白、肌球蛋白、微管蛋白、原肌蛋白等。1•2•2DNA真核细胞基因组的最大特点是它含有大量的重复序列,而且功能DNA序列大多被不编码蛋白质的非功能DNA所隔开。许多DNA序列不编码蛋白质,是无生理功能的。真核细胞DNA序列大致上可被分为3类:(1)不重复序列在单倍体基因组里,这些序列一般只有一个或很少的几个拷贝,它占DNA总量的40%—80%。不重复序列长约750—2000bP,相当于一个结构基因的长度。结构基因属于不重复序列。单拷贝基因通过基因扩增可以合成大量的蛋白质,一个蛋白基因作为模板可以合成10,个相应mRNA,每个mRNA可存活4d,共合成105个相应蛋白,这样,一个单拷贝蛋白基因就可以合成10"个蛋白分子。(2)中度重复序列这类序列的重复次数在10〜1。'之间,占总DNA的10%〜40%,各种rRNA、tRNA以及某些结构基因(如组蛋白基因等)都属于这一类。。中度重复序列往往分散在不用:复序列之间。
152.1染色体・27・同展区28Ss.asus间隔区28sS.8S18S用2-6非洲爪蝶的rRNA基因结构示意图(3)高度重复序列一一卫星DNA这类DNA只在真核生物中发现,占基因组的10%〜60%,由6〜100个碱基组成,在DNA链上串联重复高达数百万次。卫星DNA是不转录的。1-2-3染色质和核小体由DNA和组蛋白组成的染色质纤维细丝是许多核小体连成的念珠状结构。核小体是由H2A、H2B、H3、H4各两个分子生成的8聚体和由大约200bpDNA组成的。八聚体在中间,DNA分子盘绕在外,而III则在核小体的外面。每个核小体只有一个H1。用核酸酶水解核小体后产生的核心颗粒含146bpDNA和组蛋白八聚体,146bpDNA绕在核心外面形成1・75圈,每圈约80bp。许多核小体构成了连续的染色质DNA细丝。50am(b)图2-7使/卜体单体的存在及核心颗粒的形成(•)核小体结构示意图:《b)从电Ut下—到的染色旗结构;(©)核小体单元的产生相近(图2-8)。
16■»善*1。个■at的0色演双・DNA一个■■中收*30个・厘钦E2■个CE厘状岫*中■旬6个坏伏DZAB个讦秋憾种中禽'W75OOObp30amMg0色体DNA的*珠伏HR2-8Ok色体DNA岫2示・ffi(a)30nmG色体—怜阳;(b)双■嫉DNA缢£1—系列包款通力弱色体的过锂Ifi示注:详细解释上图(每个环状结构中含62.5圈螺线管)。人中期染色体中含6.2xlO、p,其理论长度应是200cm,这么长的DNA被包装在46个5nm长的圆柱体(染色体)中,其压缩比约为10000。大家能否从染色体的组装看出生物体构成的精密和神奇?1•3原核生物基因组原核生物的基因组很小,大多只有一条染色体,且DNA含量少。注意染色体外遗传基因的概念:即细菌的质粒、真核生物的线粒体、高等植物的叶绿体等所含有的DNA和功能基因。下边从基因组的组织结构来看原核细胞DNA的特点。1•3•1结构简练原核DNA分子的绝大部分是用来编码蛋白质的,只有非常小的一部分不转录。而且,这些不转录DNA序列通常是控制基因表达的序列,包括了RNA聚合酶结合位点、转录终止信号区及核糖体结合位点等基因表达调控元件。这些不转录DNA序列不像真核DNA的内含子编码区。真核DNA的内含子编码区显得多余而且占DNA总量的比例很大。1,3•2存在转录单元原核生物DNA序列中功能相关的RNA和蛋白质基因,会丛集在基因组的特定部位,形成转录单元,它们可被一起转录为可翻译多个蛋白质的mRNA分子,这种mRNA叫多顺反子mRNA。在大肠杆菌中,由几个结构基因及其操纵基因、启动基因组成的操纵子是一种转录功能单位。例如组氨酸操纵子转录成一条多顺反子mRNA,再翻译成组氨酸合成途径中的9个酶。1-3-3有重叠基因一般说来,基因是一段DNA序列,这段序列负责编码一个蛋白质或一条多肽。但是,在一些细菌和动物病毒中有重尚基因,即同一段DNA能携带两种不同蛋白质的信息。重叠基因主要有以下几种情况:(1)一个基因完全在另一个基因里面。(2)部分重叠.
17(3)两个基因只有一个碱基对的重叠。有的重叠基因的重叠部分翻译相同序列的肽段:有的翻译不同的肽段,这是因为翻译起点错位引起的。基因重叠可能是生物进化过程中自然选择的结果。2DNA的结构DNA是遗传的物质基础,基因是具有特定生物功能的DNA序列。研究DNA的分子结构,可以从化学键的水平解释DNA是怎样起遗传作用的;是如何来完成上一代的性状准确地在下一代表现出来这一过程的。2•1DNA的一级结构DNA是高分子化合物,其基本单位是脱氧核甘酸。在所有的DNA分子中,磷酸和脱氧核糖是不变的,而含氮碱基是可变的,主要有4种,即腺喋吟(A)、鸟噂吟(G)、胞喘陡(C)和胸腺嚅咤(T)。脱氧核甘酸可分别称为腺喋吟脱氧核甘酸、鸟噂吟脱氧核昔酸、胞嚅咤脱氧核甘酸和胸腺喀咤脱氧核甘酸。许许多多个脱氧核甘酸经3'的羟基与5'的核昔三磷酸反应形成磷酸二酯键聚合而成为DNA链。DNA通常以线性或环状形式存在,绝大多数DNA分子都由碱基互补的双链构成,也有少数生物以单链形式存在,如某些噬菌体和病毒。所谓DNA的一级结构,就是指4种核甘酸的连接及其排列顺序。DNA具有严格的化学组成,还具有特殊的空间结构,它主耍以有规则的双螺旋形式存在,其基本特点是:(l)DNA分子是由两条互相平行的脱氧核甘酸长链盘绕而成的;(2)DNA分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧;(3)两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。这就是噪吟与喀咤配时,而目.腺噪吟(A)只能与胸腺喀陡(T)配对,鸟噪吟(G)只能与胞嚏咤(C)配对。A—T,C—G要很熟悉。组成DNA分子的碱基虽然只有4种,碱基可以任何顺序排列,构成了DNA分子的多样性。例如,某DNA的ATGC的排列方式几乎是无限的。每个DNA分子所具有的特定的碱基排列顺序构成了DNA分子的特异性,不同的DNA链可以编码出完全不同的多肽。2•2DNA的二级结构DNA的二级结构是指两条多核甘酸链反向平行盘绕所生成的双螺旋结构。在生物活体中,不论DNA的二级结构还是高级结构,都是时刻变化的。通常情况下,DNA的二级结构分两大类:右手螺旋(A-DAN,B-DNA)和左手螺旋(Z-DNA)»通常情况下DAN的构象为B-DNA,若DNA双链中一条链被相应的RNA链所替换,会变构成A-DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的RNA链间形成的双链就是A-DNA。B-DNA双链都被RNA链所取代而得到由两条RNA链组成的双螺旋结构也是A-DNA。Z-DNA构象在转录区上游离转录区近时,抑制转录;如果离转录区远,可以增加转录区的负超螺旋程度,促使转录。Z-DNA结构起到转录的起始的调节作用。
18K'一?OHHOH图2-92-脱气核―(左)和核■(右)结构式衰Z-7M占、第普和核昔・・基俵普舞・崎(adtmine)一音(adentMine)鸟嗓吟(guanine)鸟音(panoeine)Ml*<«(cytosine)Ml音(cytidine)骨腕/噫(thymine)1Ml甘(thygdine)尿出咬(uracil)尿甘(uridine)接甘・RNADNAMff*(adenylicacid)AMPdAMP鸟苫■(guanyHcacid)GBtPdGMP脑甘酸(cTtidyticacid)CMPdCMPW«tt(thymklylicacid)dTMP尿昔酸(uridylicacid)UMPDNA的两条反向平行的多核甘酸链围绕同一中心轴构成螺旋结构。多核甘酸的方向由核甘酸间的磷酸二酯键的走向决定,一条从5'f3,,另一条从3'~5'。链间有螺旋型的凹槽,其中一条较浅,叫小沟;一条较深,叫大沟。两条链上的碱基以氢键相连,G与C配对,A与T配对。碱基对层叠于双螺旋的内侧。顺着螺旋轴心从上向下看,可见碱基平面与纵轴垂直,且螺旋的轴心穿过氢键的中点;相邻碱基对平面之间的距离为0«3^,即顺中心轴方向,每隔0•34nm有一个核甘酸,以3•4nm为一个结构重复周期。核甘酸的磷酸基团与脱氧核糖在外侧,通过磷酸二酯键相连接而构成DNA分子的骨架。脱氧核糖环平面与纵轴大致平行。双螺旋的宜径为2♦Onmo图2-12DNA双缥旋结构中基配对示意图《A与T.G与C配对)
193.6nm0.34nm大沟小沟氢键硝酸精音使图2-13DNA的反向平行双螺旋结构2.3DNA的高级结构DNA的高级结构是指DNA双螺旋进一步扭曲盘绕所形成的特定空间结构。超螺旋结构是DNA高级结构的主要形式,可分为正超螺旋与负超螺旋两大类。图2-15用电话机连线做模型说明DNA钱中的螺旋与超螺旋让螺旋数增多而形成的超螺旋为正超螺旋;让螺旋数减少而形成的超螺旋为负屈螺旋。DNA通常以B-DNA双螺旋分子的形式存在,在B-DNA双螺旋结构中,一般每转一圈有10个核苜酸对。若DNA双螺旋额外地多转或少转儿圈,而DNA每转圈右必须保持10个核甘酸对(如果转一圈不能保持10个核甘酸对,分子内就会出现一个单链区),当双螺旋链的另一末端是自由的时,可通过链的转动来消除这种多转或少转几圈造成的问题,从而保持原来的双螺旋结构;若此时DNA分子的末端是固定的或是环状分子,双链不能自由转动,额外的张力就导致DNA分子内部原子空间位置的重排,造成扭曲,即出现超螺旋结构。超螺旋是DNA三级结构的一种普遍形式,双螺旋DNA的松开导致负超螺旋,而拧紧则导致正超螺旋。3DNA的复制前面讲过,生命的遗传实际上是染色体DNA自我复制的结果。染色体DNA的自我复制是半保留复制,以亲代DNA分子为模板合成子代DNA。细胞分裂时,通过DNA准确地自我复制(self-replication),亲代细胞所含的遗传信息就原原本本地传送到子代细胞。亲代DNA
20以自身分子为模板来合成新的分子一准确地复制成两个拷贝,并分配到两个子代细胞中去,完成其遗佞信息载体的使命。2•1DNA的半保留复制机理由于DNA分子由两条多核甘酸链组成,一条链上的碱基一一G只能与另一条链上的C相配对,A只能与T相配对,所以,两条链是互补的,一条链上的核甘酸排列顺序决定了另一条链上的核廿酸排列顺序。就是说,DNA分子的每一条链都含有合成它的互补链所需的全部信息。DNA在复制过程中碱基间的氢键首先断裂,双螺旋解旋并被分开,每条链分别作为模板合成新链,产生互补的两条链。这样新形成的两个DNA分子与原来DNA分子的碱基顺序完全一样。因此,每个子代分子的一条链来自亲代DNA,另一条链则是新合成的,这种复制方式被称为DNA的半保留复制(semiconservartivereplication)«用力标记的培养基,CsCl离心密度标记(0);在“N的培养基培养1代、2代和三代。原核生物和真核生物DNA都是以半保留复制方式遗传的。DNA的这种平保留复制保证了DNA在代谢上的稳定性。经过许多代的复制,DNA多核甘酸链还完整地存在于后代而不被分解。3*2复制的起点、方向和速度复制时,双链DNA要解开成两股链分别进行,所以,这个复制起点呈现叉子的形式,被称为复制叉。
21先导隹图2-17DNA链的复制过程示意图(a)DNA改变双螺旋构象,解链酶解开双链,在单链DNA结合蛋白(SSB)和DNA聚合酶III的共同作用下合成先导链,方向与复制叉推进的方向一致。在滞后链上,当复制叉进一步打开时,RNA引物才能与DNA单链相结合;(b)滞后链合成时,产生冈崎片段;(c)复制叉继续前进,DNA引物酶合成新的RNA引物,与DNA单链相结合准备引发合成新的冈崎片段DNA的复制是由固定的起始点开始的。一般把生物体的复制单位称为复制子(replicon)。一个复制子只含一个复制起点。通常,细菌、病毒和线粒体的DNA分子都是由单个复制子完成复制的,而真核生物基因组则同时在多个复制起点上进行复制,它们的基因组包含有多个复制子。察2-9部分生物复制子的比较物种细胞内复制子数目/个平均长度/kb复制子移动速度/(bp-min-1)大肠杆菌,1420050000薛母50040?果蝇3500402600蜻绘15000200500蚕豆35000300?无论是原核生物还是真核生物,DNA的复制主要是从固定的起始点以双向等速复制方式进行的。复制叉以DNA分子上某一特定顺序为起点,向两个方向等速生长前进。EB2-18放射性标记实验证明DNA的复制是从固定的起始点双向等速进行的(•)DNA仅用「H)的嚅魄标记10min即压XDNA在「HJ标记10min后又ntl*非标记合成10min.*致X光片上的复M叉变长,WIIB粒分布广而稀少•
22一个生物体基因组的复制起点是固定的,复制起点为固定的序列,这个固定的序列识别参与复制起始的特殊蛋白质。复制叉移动的方向和速度以双向等速方式为主。3-3复制的几种主要方式生物体内DNA双链的复制大都是以半保留方式进行的,这是共性。不同生物体内DNA分子的存在形式各不相同(有大、有小;有线性分子、有环状分子),功能状态也不一样(有的保守、有的极为活跃),因而反映在复制方式上也有差别,这是个性,包含在半保留复制之中。绝大多数复制是以复制叉的形式进行的,介绍几种复制机制:3•3•1线性DNA双链的复制复制叉生长方式有单一起点的单向(如腺病毒)。冈崎片段3.3.2环状双向复制(如环状细菌)和多个起始点的双向复制(真核生物)。在相邻复制叉的复制泡相遇处,新生DNA融合形成复制完整的DNA。(|1)一个环状细胞的复加子的双向黛..两个现制叉均从起始点(O)向背向终点行迸(T).于植DNA用祖战表示:X株生物的多双■子.摊一起始点均用黑点表示
234原核生物和真核生物DNA的复制特点4•1原核生物DNA的复制特点大肠杆菌基因组以双链环状DNA分子的形式存在,其DNA复制的中间产物可形成一个0,复制从定点开始双向等速进行,复制起始区位于其遗传图。复制起始后,两个复制叉在距起始点1800处会合。图2-19大肠杆菌质粒DNA双向复制的模式与实验验证上:8形复制模式图;下:'H标记质粒DNA合成图起始:首先起始复合体(DnaA-ATP)与4乘9bp结合,3乘13bp(富含AT)在H型拓扑异构酶的作用下,使3乘13bp区域松弛,在再DNA解旋酶的作用下,3乘13bp区域发生解链;复制泡被单链结合蛋白(SSB蛋白)覆盖,以免断裂和再复性(与互补链形成双链);DNA诱发酶结合到模板DNA上并合成一段短的RNA,作为合成DNA的引物,引发第一个复制叉的先导链的复制,接下来是双向复制。3X13bp直接重复序列DnaA结合位点,4X9bp।tt।*r保守序列保守序列GATCTNTTNTTTTTTATCCACA图2-21大肠杆菌DNA复制起始点(oriC)保守序列分布图延伸:随着复制叉的解开,先导链在DNA合成iWIII的作用下跟着延伸:另一方面,一个包含DnaB解旋酶和DNA引物酶的移动复合体在后随链上隔1000〜2000核苜酸合成•个RNA引物。先导链和后随链的延伸均由DNA合成酶HI来完成。后随链一旦被DNA合成酶川的延伸时,冈崎片段上的RNA引物被就被DNA合成酶1切掉,所留下的缺口被紧接着的后随链延伸来填补。终止:两个复制叉在oriC约180°的对面相遇,在这个区域有几个Ter(20bp左右)的位点,它们与Tus(DnaB解旋酶抑制剂)结合成Ter-Tus复合物,Ter-Tus复合物阻止复制叉的移动,等到相反方向的复制叉到达后,(由于两条子链是相扣的)在DNA拓扑异构酶IV的作用下使复制叉解体,释放子链DNA。
24ori*■4X9bp*MSI6.4蜘DZAX*1IS2-22HjAiMbfTMIC鲤1H&端点处,JI发邮JI>naM1MX4:W»》在HU0白和ATP的共画作JXF.LHwA3x13bpKHf度斤必任性.膨血开胃,(c)I>»»B(六体分另,J,WS3»NA柏拿吉今Oo-CI的VW助).进——步■开DIVAXR»4.2真核生物DNA的复制特点真核生物DNA的复制与原核生物DNA复制有很多不同,例如,真核生物每条染色质上可以有多处复制起始点,而原核生物只有一个起始点;真核生物的染色体在全部完成复制之前,各个起始点上DNA的复制不能再开始,而在快速生长的原核生物中,复制起始点上可以连续开始新的DNA复制,表现为虽只有一个复制单元,但可有多个复制叉。(解释下边两张图说明之)真核生物DNA的复制子被称为ARS(autonomouslyreplicatingsequences自主复制序列),长约150bp左右,包括数个复制起始必需的保守区。真核生物DNA复制的起始需要起始原点识别复合物(ORC)参与。真核生物DNA复制叉的移动速度比原核生物慢得多(大约只有50bp/s,还不到大肠杆菌的1/20)»由于真核生物复制速度慢以及染色体在全部完成复制之前,各个起始点上DNA的复制不能再开始其这两点,若其染色体上只有一个复制起点,要完成代复制的时间太长(如人染色体每条按1亿
25计算,完成一代复制的时间为2X106S)o真核生物以每条染色质上有多处复制起始点来克服这个问题。人类DNA中每隔30000bp〜300000bp就有一个复制起始位点。在真核细胞中主要有5和WNA聚合酶,分别称为DNA聚合酶a、B、丫、6和e。真核细胞的DNA聚合酶均以dNTP为底物,需M1+激活,聚合时必须有模板链和具有3'-0H末端的引物链,链的延伸方向为5'f3'。但真核细胞的DNA聚合酶一般都不具有核酸外切酶活性(原核细胞的DNA聚合酶都不具有核酸外切酶活性),推测一定有另外的酶在DNA复制中起校对作用。DNA聚合酶a的功能主要是引物合成。DNA聚合酶B主要在DNA损伤的修复中起作用。DNA聚合酶5是主要负责DNA复制的胸,参与先导链和滞后链的合成。而DNA聚合酶e的主要功能是补全去掉RNA引物后的缺口。4•3DNA复制的调控原核细胞中DNA链延伸的速度几乎是恒定的,其生长、增殖速度取决于复制叉的数量。迅速分裂的细胞具较多复制叉,而分裂缓慢的细胞复制叉较少并出现复制的间隙。细胞内复制叉的多少决定于复制起始频率的高低。复制起始频率的直接调控因子是蛋白质和RNA。4•3•1大肠杆菌染色体DNA的复制调控大肠杆菌染色体DNA的复制的开始由起始物位点和复制起点两部分相互作用而引起。起始物位点编码复制调节蛋白质,复制起点与调节蛋白质相互作用并启动复制。起始物位点突变使复制停止并导致细胞死亡。4-3-2真核细胞DNA的复制调控真核细胞的生活周期可分为4个时期,G,,S、G,和M期。Gi是复制预备期,S为复制期,G2为有丝分裂准备期,M为有丝分裂期。DNA复制只发生在S期。真核细胞中DNA复制有3个水平的调控:(1)细胞生活周期水平调控:即限制点调控。决定细胞停留在G期还是进入S期。促细胞分裂剂、致癌剂等都可诱发细胞由G期进入S期、诱导DNA的复制。许多外部因素和细胞因子参与限制点调控。四磷酸二腺苜和聚ADP-核糖诱导DNA的复制。(2)染色体水平调控:决定不同染色体或同一染色体不同部位的复制子按一定顺序在S期起始复制。(3)复制子水平调控:决定复制的起始与否。这种调控从单细胞生物到高等生物都是决定DNA复制开始与否的。真核生物复制起始还包括转录活化、复制起始熨合物的合成和引物合成等阶段。5DNA的修复由于染色体DNA在生命过程中占有至高无上的地位,DNA复制的准确性以及DNAFI常保养中的损伤修复就有着特别重要的意义。下表是存在于大肠杆菌中的DNA修复系统。
26衰2--12大肠杆莺中DNA的修复系统DNA修复系统功能错配修复恢复错配碱基切除修复切除突变的碱基核昔酸切除修复修复被破坏的DNADNA直接修复修复噫喔二体或甲基化DNA5•1错配修复错配修复(mismatchrepair)可以将DNA子链中的错配几乎完全能被修复,充分反映了母链的雨耍性。该系统识别母链的依据来自Dam甲基化酶,它能使位于5'GATC序列中腺甘酸的N,位甲基化。一旦复制叉通过复制起始位点,母链就会在开始DNA合成前的一小点时间(几秒钟至几分钟)内被甲基化。此后,只要两条DNA链上碱基配对出现错误,错配修复系统就会根据"保存母链,修正子链”的原则,找出错误碱基所在的DNA链,并在对应于母链甲基化腺甘酸上游鸟甘酸的5'位置切开子链。5.2碱基切除修复所有细胞中都带有不同类型、能识别受损核酸位点的糖甘水解酶,它能特异性切除受报核甘酸上的N-B一糖昔健,在DNA链上形成去噪吟或去喀咤位点(AP位点)。DNA分子中一旦产生了AP位点,AP核酸内切酶就会把受损核甘酸的糖甘-磷酸键切开,并移去包括AP位点核甘酸在内的小片段DNA,由DNA聚合酶I合成新的片段,最终由DNA连接酶把两者连成新的被修复的DNA链,这一过程即为碱基切除修复(base-excisionrepair)。图2-“根据电械甲基化原则找出错配“稚的冰:意图(a)发现*摘憎配Mb)在水翩ATP的作HJ下・MmS.MutL与0童械配位点的DNA双集相结合Me〉Mut»-M“tL在DNA双毋上移动.发:现甲.墓化ONA后由MutH切开非甲基化的FM
27•52-2款色体勺DNADNA外切编VIADP・R,ADPS,-MutSDNA解总onDNAJR合・[^图2・26碱基槽配修复过程示意图当修配9慕位于切口3'下蹲端时,在MutL-MutS,修链■D.DNA外切||VI或RecJ核酸■的作用下,从傅配减答3,下游端开始切除单集DNA直到鼻切口,并在Poi■和SSB的作用下合成新的子候片段°若错配M基位于切口的5'上游■,则在DNA外切*1或X的作用下,从错配减基5'上密端开始切除单链DNA直到原切口,再合成新的子.fit片段图2-27DNA分子中意见的几A核甘取非“促转变反应(•)脱氨基反应Mb)脱♦冷反应(N-B精甘区被水解)
285-3核昔酸切除修复当DNA链上相应位置的核甘酸发生损伤,导致双链之间无法形成氢键,则由核甘酸切除修复(nucleotide-excisionrepair)系统负贡修复。下图分别是大肠杆菌(左)和人类细胞(右)中的修复过程。损伤发生后,首先由DNA切割酶(excinuclease)在己损伤的核甘酸5'和3'位分别切开磷酸糖苜键,产生一个由12〜13个核甘酸(原核生物)或27〜29个核苛酸(人类或其他高等真核生物)的小片段,移去小片段后由DNA聚合酶I(原核)或e(真核)合成薪的片段,并由DNA连接酶完成修复中的最后一道工序。(4)dna««NDNA3KM图2-28大曲杆BK左)和人类细附(右)中的核甘噬切除修复过程’示意图在原核生物中受帙甘股3'编的第5位.5'*的第8位璘酸精件分别被DNA切制*切开。在人类细胞中.受损伤核甘酸3,嫡第6位,螭的第22位确酸/甘健分别被DNA切割・切开5.4DNA的直接修复生物体内还存在多种DNA损伤以后直接修复(directrepair),而并不需要切除碱基或核苜酸的机制。下面两个例子:1、在DNA光解酶(Photolyase)的作用下把在光下或经紫外光照射形成的环丁烷胸腺喀咤二体及6-4光化物(6-4photoproduct)还原成为单体的过程。2、生物体内还广泛存在着使炉-甲基鸟噂吟脱甲基化的甲基转移酶,以防止形成G-T配对。图2-30O,-甲基转移能使0'-甲基干鸟嚎吟恢复成鸟原吟
29BB2-29球外比例发形成噫碇二住5DNA的重组一个生物个体基因组获得了外来DNA片段,称为DNA重组。DNA重组属于基因工程范围,生物体内的DNA重组为不同个体间的基因交换,这可以保证遗传的多样性,为适者生存的选择奠定物质基础。从DNA序列和所需蛋白质因子的要求把重组分为4类:同源重组、位点专一性重组、转座重组和异常重组。6.1同源重组同源重组过程涉及两个DNA分子间同源区域的交换。例在大肠杆菌中,二个同源DNA双螺旋排列在一起(如图a),通过核酸酶和RecBCD蛋白复合体的作用在一对姐妹染色单体(序列相同的单体)上产生切口,切口具体发生在称为chi(GCTGGTGG)的特定序列上,该序列大约每4kb就有一个(图b)。含有5'端切口的单链DNA被RecA蛋白包裹形成RecA-ssDNA辘,这些细丝相互交换并寻找相对的DNA双螺旋上的相应序列(侵入,如图c),这之后切口被封好并形成四分支的Holliday结构(图d)。这个结构是动态的,交叉点左右任何两个方面移动相当一段距离(分支迁移,如图e),这个Holliday中间体能以两种方式中的一种拆分为两个DNA双螺旋。如果两条侵入链被切断,那么所产生的重组体除了中间的交换部分之外与原来的分子都是一样的(如图f)。如果是非侵入链被断开,则产生的重组体一半来自父本,另一半则来自母本,形成两个亲本杂合双螺旋(图g)。ffiF4.12个DZA双螺"分子的间**加的Holl&y6.2位点特异性重组位点特异性重组指非同源DNA的特异片段之间的交换,由能识别特异DNA序列的蛋白质所介导,并不需要RecA或单链DNA。入噬菌体可将自身基因组插入E•coli染色体的特定位点,两者DNA
30上的连接位点处有15bp的序列是相同的。入噬菌体编码的整合酶(Int)可在这些序列上形成具7个bp的突出端的交错切口,并与细菌编码的整合宿主因子(IHF)一起促成这些位点与A-DNA间的重组结果和X-DNA进入宿主染色体。这种方式形成的人噬菌体称为原噬菌体,随细胞分裂而稳定遗传,直至入噬菌体所编码的切除酶被激活,整个过程倒过来及X噬菌体从整合体中释放出来。图320通过位点专一性重组.A噬菌体整合到大的杆菌染色体中m62i住加“〃/<其网的谯q上之愉切斯•通过女义•禽产生相”体总倭a1S76.3DNA的转座(转座重组)DNA的转座,或称移位(transposition),是由可移位因子(transposableelement)介导的遗传物质重组。转座子是一些较短的DNA序列,可以转移到细胞基因组的任何位置,因为它不需要序列间具有同源性,也不是位点特异性的,所以转座作用又被称为异常重组与DNA的同源市:组相比,转座作用发生的频率要低得多。转座作用能说明在细菌中发现的许多基因缺失或倒转现象,而且它常被用于构建新的突变体。在转座过程中,可移位因子的一个拷贝常常留在原来位置上,在新位点上出现的仅仅是它的拷贝。转座依赖于DNA的复制。6.3.1转座子的分类和结构特征转座子(transposon,Tn)是存在于染色体DNA上可自主复制和位移的基本单位。最简单的转座子不含有任何宿主基因而常被称为插入序列(insertionalsequence,IS),它们是细菌染色体或质粒DNA的正常组成部分。一个细菌细胞常带有少于10个IS序列。转座子常常被定位到特定的基因中,造成该基因突变。科学上用标准命名法对这些突变进行编号,如入::IS1表示有一个IS1序列插入到噬菌体入基因组内。IS序列都是可以独立存在的单元,带有介导自身移动的蛋白。它们都是很小的DNA片段(约Ikb),末端具有倒置重更序列,转座时往往复制宿主靶位点一小段(4〜15bp)DNA,形成位于IS序列两端的正向重复区。
31宿主DNA纪序奥复合式转座子(compositetransposon)是一类带有某些抗药性基因(或其他基因)的转座子,其两翼往往是两个相同或高度同源的IS序列,表明IS序列插入到某个功能基因两端时就可能产生复合转座子。图2-32复合转座子的两端往往各有一个IS序歹/在每个IS序列两侧各有倒置重复序列一旦形成复合转座子,IS序列就不能再单独移动,只能作为复合体移动。mRNA靶位点复制左倒转重复(38bp)I1—I解高解2内酰技HQ纪位点复制介绍TnA家族:没有IS序列、体积庞大(5000bp以上)、带有3个基因,其中一个编码内酰胺酶(AmpR),另两个则是转座作用所必须的。这类转座子两翼带有38bp的倒置用复序列。右倒转重复(38bp)图2-33转座子TnA的结构示意图6.3.2转座作用的机制转座时发生的插人作用有一个普遍的特征,就是受体分子中有一段很短的(3〜12bp)、被称为靶序列的DNA会被复制,使插入的转座子位于两个重复的靶序列之间。不同转座子的靶序列长度不同,但对于一个特定的转座子来说,它所复制的靶序列长度都是一样的,如IS1
32两翼总有9个碱基对的靶序列,而Tn3两端总有5bp的靶序列o靶序列的复制起源于特定内切酶所造成的黏性DNA末端。图2-34犯位点直接重复序列的形成转座可被分为复制性和非复制性两大类。顾名思义,在复制性转座中,整个转座子被复制了,所移动和转位的仅仅是原转座子的拷贝。转座酶和解离酶分别作用于原始转座子和复制转座子。TnA类转座主要是这种形式。与此相对应,在非复制性转座中,原始转座子作为一个可移动的实体宜接被移位,IS序列以这种方式进行转座。6.3.3转座作用的遗传学效应转座的遗传学效应主要有以下几方面:(1)转座引起插入突变各种IS、Tn都可以引起插入突变。如果插入位于某操纵子的前半部分,就可能造成极性突变,导致该操纵子后半部分结构基因表达失活。(2)转座产生新的基因如果转座子上带有抗药性基因,它一方面造成靶DNA序列上的插入突变,同时也使这个位点产生抗药性。(3)转座产生的染色体畸变当复制性转座发生在宿主DNA原有位点附近时,往往导致转座子两个拷贝之间的同源重组,引起DNA缺失或倒位。若同源重组发生在两个正向市复转座区之间,就导致宿主染色体DNA缺失;若重组发生在两个反向重复转座区之间,则引起染色体DNA倒位。
33(4)转座引起的生物进化由于转座作用,使一些原来在染色体上相距甚远的基因组合到一起,构建成一个操纵子或表达单元,可能产生一些具育新的生物学功能的基因和新的蛋白质分子。思考题:1、DNA的一级结构、二级结构和高级结构。2,DNA的保留复制的特点和意义。第三章生物信息的传递(上)一从DNA到RNA教学内容:1、RNA的转录;2、启动子与转录起始;3、原核生物与真核生物mRNA的特征比较:4、终止与抗终止;5、内含子的剪接、编辑及化学修饰。教学目的:让学生掌握以上基本内容。教学重点是1、RNA的转录;2、启动子与转录起始;3、原核生物与真核生物mRNA的特征比较。讲课具体内容DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成信使RNA、翻译生成蛋白质的过程来控制生命现象。基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(U替换T)的RNA单链的过程,是基因表达的核心步骤;翻译是指以新生的mRNA为模板,把核甘酸三联遗传密码子翻译成氨基酸序列、合成多肽链的过程,是基因表达的最终目的。与mRNA序列相同的那条DNA链称为编码链(codingstrand)或称有意义链(sensestrand),并把另一条根据碱基互补原则指导mRNA合成的DNA链称为模板链(templatestrand)或称反义链(antisensestrand)。贮藏在任何基因中的生物信息都必须首先被转录生成RNA,才能得到表达。RNA主要以单链形式存在于生物体内,其高级结构很复杂,它们既担负着贮藏及转移遗传信息的功能,又能作为核醒直接在细胞内发挥代谢功能。RNA分子来自DNA。储存于DNA双链中的遗传信息通过转录酶促反应按照碱基互补配对的原则被转化成为单链RNA分子。生物体内共有3种RNA:1、信使RNA(messengerRNA,mRNA)一编码特定蛋白质序列;2、懒RNA(transferRNA,tRNA)一特异性解读mRNA中的遗传信息、将其转化成相应氨基酸并将其加入多肽链中;3、核糖体RNA(ribosomalRNA,rRNA)直接参与核糖体中蛋白质合成。3.1RNA的转录
343•1•1转录的基本过程无论是原核还是真核细胞,转录的基本过程都包括:模板识别、转录起始、通过启动子及转录的延伸和终止(图3D)。转录海图3-2大S6杆菌中依粳于DNA的RNA转录过程图示(•)在转录的任意时刻,转录泡中单链DNA的长度约在17bp左右,被聚合形成复合物所保护的DNA序列约为35bp;(b)由于基因转录所引起的DNA超螺旋结构变化在原核生物中,模板识别阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。转录起始前,启动子附近的DNA双键分开形成转录泡以促使底物核糖核昔酸与模板DNA的碱基配对。转录起始就是RNA链上第一个核昔酸键的产生。转录起始后直到形成9个核酸昔短链是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。一旦RNA聚合酶成功地合成9个以上核昔酸并离开启动子区,转录就进人正常的延伸阶段。所以,通过启动子的时间代表一个启动子的强弱。一般说来,通过启动子的时间越短,该基因转录起始的频率也越高.RNA聚合醒离开启动子,沿DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸。在37C时,大肠杆菌RNA聚合酶完成该反应的速度为每秒40个核甘酸。随着RNA聚合酶的移动,DNA双螺旋持续解开,暴露出新的单链DNA模板,新生RNA链的3,末端不断延伸,在解链区形成RNA-DNA杂合物。而在解链区的后面,DNA模板链与其原先配对的非模板链重新结合成为双螺旋。当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来,这就是转录的终止。真核生物RNA聚合酶不能直接识别基因的启动子区,需要被称为转录调控因子的辅助蛋白质按特定顺序结合于启动子上,RNA聚合酶才能与之相结合并形成复杂的前起始复合物(preinitiationtranscriptioncomplex,PIC),以保证有效地起始转录。转录和翻译的速度基本相等,37C时,转录生成mRNA的速度大约是每分钟2500个核甘酸,即每秒钟合成14个密码子,而蛋白质合成的速度大约是每秒钟15个氨基酸。正常情况下,从一个基因开始表达到细胞中出现其mRNA的间隔约为2.5min,
35而再过半分钟就能在细胞内测到相应的蛋白质。3•1•2转录机器的主要成分3•1•2•1RNA聚合酶以DNA序列为模板的RNA聚合酶主要以双链DNA为模板(若以单链DNA做模板,则活性大大降低),以4种核甘三磷酸作为活性前体,并以Mg2+/Mn2+为辅助因子,催化RNA链的起始、延伸和终止,它不需要任何引物,催化生成的产物是与DNA模板链互补的RNA.RNA或RNA-DNA双链杂合体不能作为模板。RNA聚合酶是转录过程中最关键的酶。原核和真核生物的RNA聚合酶都能催化RNA的合成。在其分子组成、种类和生化特性上各有特色。大多数原核生物RNA聚合酶的组成是相同的,大肠杆菌RNA聚合酶由2个a亚基、一个。亚基、一个B'亚基和一个3亚基组成,称为核心酶。加上一个。亚基后则成为聚合酶全酶(holoenzyme),相对分子质量为4.65X10,(图3-3).图3-3大肠杆菌RNA聚合屏的主要成分与功能分析由6和B'亚基组成了聚合酶的催化中心。B亚基能与模板DNA、新生RNA链及核昔酸底物相结合。a亚基与核心酶的组装及启动子识别有关,并参与RNA聚合酶和部分调节因子的相互作用。。因子的作用是负责模板链的选择和转录的起始,它使酶专一性识别模板上的启动子。。因子可以极大地提高RNA聚合酶对启动子区DNA序列的亲和力,酶底结合常数提高103倍,酶底复合物的半衰期可达数小时甚至数十小时。。因子还能使RNA聚合酶与模板DNA上非特异性位点的结合常数降低10,倍,使酶底复合物的半衰期小于夙因此,加入。因子以后,RNA聚合酶全酶识别启动子序列的特异性总共提高了倍。每个细胞中约有7000个RNA聚合酶分子,每一时刻有2000〜5000个酶在执行转录DNA模板的功能。。因子大大增加聚合酶对启动子的亲和力,并降低酶对非专一位点的亲和力,使酶专一性识别模板上的启动子。在某些细菌细胞内含有能识别不同启动子的。因子,以适应不同生长发育阶段的要求,调控不同基因转录的起始。例如,枯草杆菌中就有6种不同相对分子质量的。因子,其中o,,(右上角的数字代表相对分子质量,xl(T)是枯草杆菌RNA聚合酶中。因子的主要存在形式,出现在营养细胞中,而。1则主要出现在抱子形成阶段,参与袍子形成期基因转录的调控。在大肠杆菌中,最常见的调控因子是由poD基因所编码的o'o,由p。廿编码的。”是与热休克启动子所控制的基因转录密切相关,而由仰N编码的产则参与细胞的氮代谢(表3-2)o此外,由W噬菌体所编码的o”能与大肠杆菌RNA聚合酶的核心酶结合,启动刊晚期基因的转录。我3-2大吊杆苜中的。因子能识别并与启动子区的特异性序列相结合因子基因功能-35区间隔-10区rpoD广泛1TGACA16〜18bpTATAAT产rpoH热休克TCTCNCCCTTGAA13〜15bpCCCCATNTAa54rpoN氮代谢CTGGNA6bpTTGCA转录的起始从化学过程来看是单个核昔酸与开链启动子一酶复合物相结合构成新生RNA的5,端,再以磷酸二酯键的形式与第二个核甘酸相结合,起始的终止反映在。因子的释放。当新生RNA链达到6〜9个核甘酸时,能形成稳定的酶一DNA-RNA三元复合物,并释放。因子,转录进入延伸期。
36当聚合酶按5,一3,方向延伸RNA链时,解旋的DNA区域也随之移动。聚合酶可以横跨约40个碱基对,而解旋的DNA区域大约是17个碱基对。自由核甘酸能被聚合酶加到新生的RNA链上,并形成DNA-RNA杂合体。随着聚合酶在模板上的运动,靠近3,端的DNA不断解旋,同时在5,端重新形成DNA双链,将RNA链挤出DNA-RNA杂合体。RNA的3,端大约有20-30个核甘酸与DNA和聚合酶相结合。真核生物中共有3类RNA聚合酶,其结构比大肠杆菌RNA聚合酶更复杂,它们在细胞核中的位置不同,负责转录的基因不同,对a-鹅膏蕈碱的敏感性也不同(表3-3)。真核生物RNA聚合酶一般有8〜14个亚基所组成,相对分子质量超过5X10、虽然不同生物3类聚合酶的亚基种类和大小各异,但存在两条普遍遵循的原则:一是聚合酶中有两个相对分子质量超过IX105的大亚基;二是同种生物3类聚合酶有“共享”小亚基的倾向,即有几个小亚基是其中3类或2类聚合酶所共有的。*3-3亶核细胞中3类RNA聚合•特性比较唧细胞内定位转录产物相对活性对a-鹅弄蕈碱的敏感程度RNA聚合醒I核仁rRNA50%〜70%不敏感RNA聚合薛U核质hnRNA20%〜40%敏感RNA聚合施皿核质tRNA约10%存在物种特异性除了细胞核中的RNA聚合酶之外,真核生物线粒体和叶绿体中还存在着不同的RNA聚合酶。线粒体RNA聚合酶只有一条多肽链,相对分子质量小于7xl04,是已知最小的RNA聚合酶之一,与T7噬菌体RNA聚合酶有同源性。叶绿体RNA聚合酶比较大,结构上与细菌中的聚合酶相似,由多个亚基组成,部分亚基由叶绿体基因组编码。线粒体和叶绿体RNA聚合酶活性不受a一鹅膏蕈碱所抑制。3•1•2•2转录复合物如前所述,转录可被分为4个阶段,即启动子的选择、转录起始、RNA链的延伸和终止。启动子选择阶段包括RNA聚合酶全酶对启动子的识别,聚合酶与启动子可逆性结合形成封闭复合物(closedcomplex).此时,DNA链仍处于双链状态。伴随着DNA构象上的重大变化,封闭复合物转变成开放复合物(opencomplex),聚合酶全酶所结合的DNA序列中有一小段双链被解开(图3-4)o对于强启动子来说,从封闭复合物到开放复合物的转变是不可逆的,是快反应。开放复合物与最初的两个NTP相结合并在这两个核昔酸之间形成磷酸二酯键后即转变成包括RNA聚合酶、DNA和新生RNA的三元复合物。除了RNA聚合酶之外,真核生物转录起始过程中至少还需要7种辅助因子参与。因为不少辅助因子本身就包含多个亚基,所以转录起始复合物的分子量特别大。
37衰3-4JI核生物RNA聚合an所形成的转录起始直合物蛋白质亚基数亚基的相对分子质量/10’功能RNA聚合薛n1210-220催化RNA的生物合成TBP138与启动子上的TATA区相结合TFIIA312,19,35使TBP及TFUB与启动子的结合比较稳定TFIIB135与TBP相结合,吸引RNA聚合博和TFUF到启动区上TFIID1215~250与各种调控因子相互作用TFIIE234,57吸引TFHH,有ATP璘及解链醉活性TFIIF230,74结合RNA聚合并在TFHB帮助下阻止聚合II与非特异性DNA序列相结合TFIIH1235-89在启动子区解开DNA双链,使RNA聚合酣U磷酸化,接纳核甘酸切除修复体系反应成分状袤3*****M。因于被修放o结合不的常敷反应速率A2-10'10'base/s反应速率10'ba«e/s・开启动区时向>1-2•全*二元闱台震:合物二元开fif震合的三元血合物RNA6破开始一般情况下,该复合物可以进入两条不同的反应途径,一是合成并释放2〜9个核昔酸的短RNA转录物,即所谓的流产式起始;二是尽快释放。亚基,转录起始复合物通过上游启动子区并生成由核心酶、DNA和新生RNA所组成的转录延伸复合物。转录的真实性取决于有特异的转录起始位点,转录起始后按照碱基互补原则准确地转录模板DNA序列及具有特异的终止部位。RNA的合成是在模板DNA的启动子位点上起始的,而这个任务是靠。因子来完成的。RNA聚合酶的核心酶虽可合成RNA,但不能找到模板DNA上的起始位点。核心酶的产物是不均一的,因为它没有固定的起始位点,而且DNA两条链都可作为模板。只有带。因子的全酶才能专一地与DNA上的启动子结合,选择其中一条链作为模板,合成均一的产物。。因子的作用只是起始而已,一旦转录开始,它就脱离了起始复合物,而由核心酶负责RNA链的延伸。因此,聚合酶全酶的作用是启动子的选择和转录的起始,而核心酶的作用是链的延伸。转录延伸复合物是转录循环中一个十分重要的环节。与转录起始复合物相比,延伸复合物极为稳定,可以长时间地与DNA模板相结合而不解离。只有在它遇到转录终止信号时,RNA聚合酶才停止加入新的核甘酸,RNA-DNA杂合物解离,释放转录产物并导致聚合酶本身从模板DNA上掉下来。
383-2启动子与转录起始大肠杆菌RNA聚合酶与启动子的相互作用主要包括启动子区的识别、酶与启动子的结合及。因子的结合与解离。下面分别介绍这3个方面的内容。3-2-1启动子区的基本结构启动子是一段位于结构基因5,端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合并具有转录起始的特异性。因为基因的特异性转录取决于酶与启动子能否有效地形成二元复合物,所以,RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布朗运动中的随机碰撞高100倍。现在我们已经知道,转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用。启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。转录单元(transcriptionunit)是一段从启动子开始至终止子(terminator)结束的DNA序列,RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细菌中,一个转录单元可以是一个基因,也可以是几个基因。转录起点是指与新生RNA链第一个核昔酸相对应DNA链上的碱基,研究证实通常为一个噂吟。常把起点前面,即5,末端的序列称为上游(upsEam),而把其后面即3'末端的序列称为下游(downstream).在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-1、-2、-3…….启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。那么,启动子区有什么结构特点呢?Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNasel水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段(图3-5),约有41〜44个核昔酸对。他先后分离了fd噬菌体、T7噬菌体的A2及A3启动子、入噬菌体的PR启动子及大肠杆菌乳糖操纵子的UV5启动子等5段被酶保护的区域,并进行了序列分析,以后又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核昔酸组成的共同序列,是RNA聚合酶的紧密结合点,现在称为Pribnow区(Pribnowbox),这个区的中央大约位于起点上游10bp处,所以又称为一10区。RNA聚合”结合到DNA特定位点加技改修]梃取DNA・定被保护DNA的序列图3-5分离转录启动子区DNA序列程序图示
39提纯被保护的片段后却发现,RNA聚合酶并不能重新结合或并不能选择正确的起始点,表明在保护区外可能还存在与RNA聚合酶对启动子的识别有关的序列。果然,科学家不久就从噬菌体的左、右启动子PL及PR和SV40启动子的一35bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个大肠杆菌启动子的序列以后,确证绝大部分启动子都存在这两段共同序列,即位于一10bp处的TATA区和-35bp处的TTGACA区(图3-6)o-60%IFCTAATIN$J3.2启动子与将录起始・73・理论上一致性序列[NNAAA咎*TTTTNNAAAANNNrrnBPl启动区序列1工1也上束,1■・盘km喊中TATAATINg[atrPITTOACA]M?ITTAACT]27rlacIEACA|[TATQTT|&|AmcAITTGATA[%]TATAAT|W-araBAD图3-6大肠杆菌RNA聚合・全摩所识别的启动子区,.-30._+1.5,,TATAAA尊:'3'多种不同的TATA区第一位转求*茶调控元件图3-7真核生物RNA聚合薛H所识别的启动子区现已查明,-10位的TATA区和-35位的TGACA区是RNA聚合酶与启动子的结合位点,能与。因子相互识别而具有很高的亲和力。在真核生物基因中,位于转录起始点上游一25〜-30bp处的共同序列TATAAA,也称为TATA区(图3-7)。另外,在起始位点上游-70〜-78bp处还有另一段共同序列CCAAT,这是与原核生物中-35bp区相对应的序列,称为CAAT区(CAATbox)。3.2.2启动子区的识别一般认为,RNA聚合酶并不直接识别碱基对本身,而是通过氢键互补的方式加以识别。在启动子区DNA双螺旋结构中,腺噂吟分子上的N‘、鸟噂吟分子上的N二胞嗑碇分子上的Z•都是氢键供体,而腺喋吟分子上的N\N\胸腺喽腔分子上的。,、O2,鸟喋吟分子上的N,、(AM和胞嗑咤分子上的。2都是氢键受体。由于它们分别处于DNA双螺旋的大沟或小沟内,因此都具有特定的方位,而酶分子中也有处于特定空间构象的氢键受体与供体,当它们与启动子中对应的分子在一定距离内相互补时,就形成氢键,相互结合。这种氢键互补学说较为圆满地解释了启动子功能既受DNA序列影响,又受其构象影响这一事实.当保守区某些碱基的取代不影响DNA上氢键的方位和特性时,启动子原有的功能保持不变;当局部DNA构象或电荷密度改变影响了这些基团的相对方位时,启动子的功能就会受到影响。3•2•3酶与启动子区的结合在RNA聚合酶与启动子相互作用的过程中,聚合酶首先与启动子区闭合双链DNA相结合,形成二元闭合复合物,然后经过解链得到二元开链复合物(图3-8)。解链区一般在-9〜+13之间,而酶与启动子结合的主要区域在其上游。一旦开链区解链,酶分子能以正确的取向与解链后的有关单链相互作用,形成开链复合物。因此,RNA聚合酶既是双链DNA结合蛋白,又是单链DNA结合蛋白。DNA开链是按照DNA模板序列正确引入核甘酸底物的必要条件。・74・3生物憎息的僧境(上)从DNA剜RNA
40.-3O__ITATAlI丁**她位点DNA|TBP(«TFnDUATPDA)|tfdb]TFIIF-RNA垂含■口|tfdb、、国3-8由RNA・合■!!指A的基因•♦第过程图示3.2.4-10区和-35区的最佳间距在原核生物中,-35区与-10区之间的距离大约是16〜19bp,小于15bp或大于20bp都会降低启动子的活性。保持启动子这二段序列以及它们之间的距离是十分重要的,否则就会改变它所控制基因的表达水平。因为一旦-35区相对于-10区旋转所产生的超螺旋发生改变(增减一个bp会使两者之间的夹角发生36°的变化),若要使酶与DNA在这个区域内保持正确的取向,就必须使二者之一发生扭曲,需要增加结合自由能。在细菌中常见两种启动子突变,一种叫下降突变(downmutation),如果把Pribnow区从TATAAT变成AATAAT就会大大降低其结构基因的转录水平;另一类突变叫上升突变(upmutation),即增加Pribnow区共同序列的同一性。例如,在乳糖操纵子的启动子中,将其Pribnow区从TATGTT变成TATATT,就会提高启动子的效率,提高乳糖操纵子基因的转录水平。4•2•5增强子及其功能除了启动子以外,近年来发现还有另一序列与转录的起始有关。在SV40的转录单元上发现它的转录起始位点上游约200bp处有两段72bp长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始,除去这两段序列会大大降低这些基因的转录水平,若保留其中一段或将之取出插至DNA分子的任何部位,就能保持基因的正常转录。因此,称这种能强化转录起始的序列为增强子或强化子(enhancer)。除SV40外,还在反转录病毒基因、免疫球蛋白基因、胰岛素基因、胰糜蛋白酶基因等许多基因的启动区中陆续发现了增强子的存在。有人曾把B-珠蛋白基因置于带有上述72bp序列的DNA分子上,发现它在体内的转录水平提高了200倍。而且,无论把这段72bp序列放在转录起点上游1400bp或下游3300bp
41处,它都有转录增强作用。增强子很可能通过影响染色质DNA-蛋白质结构或改变超螺旋的密度而改变模板的整体结构,从而使得RNA聚合酶更容易与模板DNA相结合,起动基因转录。3.2.6真核生物启动子对转录的影响所谓启动子是指确保转录精确而有效地起始的DNA序列。1979年,美国科学家伤Goldberg首先注意到真核生物中,由RNA聚合酶II催化转录的DNA序列5,上游区有一段与原核生物Pribnow区相似的富含TA的保守序列。由于该序列前4个碱基为TATA,所以又称为TATA区(TATAbox)。此后10多年间,科学家通过对许多基因启动子区的分析,发现绝大多数功能蛋白基因的启动子都具有共同的结构模式。简单地说,真核基因的启动子在-25〜-35区含有TATA序列,在-70〜-80区含有CCAAT序列(CAATbox),在-80〜-110含有GCCACACCC或GGGCGGG序歹U(GCbox)«习惯上,将TATA区上游的保守序列称为上游启动子元件(upstreampromoterelement,UPE)或称上游激活序列(upstreamactivatingsequence>UAS)o比较原核和真核基因转录起始位点上游区的结构,发现两者之间存在很大的差别(图3-9)o原核基因启动区范围较小,一般情况下,TATAAT(Pribnow区)的中心位于-7〜-10,上游-30〜-70区为正调控因子结合序列,+1〜-20区为负调控因子结合序列。真核基因的调控区较大,TATAA/TA区位于-20〜-30,而-40〜-110区为上游激活区。除Pribnow区之夕卜,原核基因启动子上游只有TTGACA区(-30〜-40)作为RNA聚合酶的主要结合位点,参与转录调控;而真核基因除了含原核生物正■控因子结合区负调控因-30-20子结合区|।1mRNARNA聚合■,主.接触位点、J,於立.以达标引——I।_-_―35-7-10图3-9原核和真核生物基因转录起始位点上游区的结构比较有可与之相对应的CAAT区之外,大多数基因还拥有GC区和增强子区。TATA区和其他两个UPE区的作用有所不同。前者的主要作用是使转录精确地起始,如果除去TATA区或进行碱基突变,转录产物下降的相对值不如CAAT区或GC区突变后明显,但发现所获得的RNA产物起始点不固定(图3-10)。
42图3-10启动子区主要喂式作用元件与B-珠蛋白基因转业活性研究SV40晚期基因启动子发现,上游激活区的存在与否,对该启动子的生物活性有着根本性的影响。若将该基因5,上游-21〜-47核昔酸序列切除,基因完全不表达(图3-11)。图3-11SV40基因启动于上TATAAA及邻近区域对基因转录活性的影响CAAT区和GC区主要控制转录起始频率,基本不参与起始位点的确定。CAAT区对转录起始频率的影响最大,该区任一碱基的改变都将极大地影响靶基因的转录强度,而启动区其他序列中一二个碱基的置换则没有太大的影响。此外,在TATA区和相邻的UPE区之间插入核昔酸也会使转录减弱,在人类B-血红蛋白基因启动区的两个UPE序列之间插入15个核甘酸,该启动子完全失去功能。尽管这3种UPE序列都有着重要功能,但并不是每个基因的启动子区都包含这3种序列。有些基因,如SV40的早期基因,缺少TATA和CAAT区,只有6个串联在上游-40〜“10位点的GC区;有些基因,如组蛋白H2B,不含GC区,但有两个CAATE,一个TATA区。研究发现,真核细胞中存在着大量特异性或组成型表达的、能够与不同基因启动子区UPE相结合的转录调控因子(表3-5).基因转录实际上是RNA聚合酶、转录调控因子和启动子区各种调控元件相互作用的结果。3.3原核生物与真核生物mRNA的特征比较信使核糖核酸用mRNA表示,是英文messengerRNA的简称。mRNA在大肠杆菌细胞内占总RNA的2%左右(tRNA占16%,而rRNA则占80%以上)。尽管科学家很早就怀疑生物细胞内存在能将遗传信息从DNA上转移到蛋白质分子上的信使(或称模板),但由于mRNA在细菌细胞内的半衰期很短,科学家直到19世纪70年代初才首次将这一重要物质从细胞中分离出来。现已清楚,许多基因的mRNA在体内还是相当稳定的,半衰期从几个小时到几天不等。目前,人们己能从几乎所有生物体内分离纯化编码任何蛋白质的mRNA。虽然mRNA在所有细胞内执行着相同的功能,即通过密码三联子翻译生成蛋白质,但其生物合成的具体过程和成熟mRNA的结构在原核和真核细胞内是不同的。真核细胞
43mRNA的最大特点在于它往往以一个较大相对分子质量的前体RNA出现在核内,只有成熟的、相对分子质量明显变小并经化学修饰的mRNA才能进入细胞质,参与蛋白质的合成。所以,真核细胞mRNA的合成和功能表达发生在不同的空间和时间范畴内。原核生物中,mRNA的转录和翻译不仅发生在同一个细胞空间里,而且这两个过程几乎是同步进行的,蛋白质合成往往在mRNA刚开始转录时就被引发。一个原核细胞的mRNA(包括病毒)有时可以编码几个多肽,而一个真核细胞的mRNA最多只能编码一个多肽。原核生物常以AUG作为起始密码子,但有时GUG或者UUG也作为起始密码子;这一点真核生物就不同,几乎永远以AUG作为起始密码子。3•3•1原核生物mRNA的特征1•原核生物mRNA的半衰期短细菌基因的转录与翻译是紧密相联的,基因转录一旦开始,核糖体就结合到新生mRNA链的5,端,启动蛋白质合成,而此时该mRNA的3,端还远远没有转录完全。在电子显微镜下,我们可以看到一连串核糖体紧紧跟在RNA聚合酶后面。绝大多数细菌mRNA的半衰期很短,mRNA的降解紧随着蛋白质翻译过程发生。转录开始1min后,降解就开始了,当一个mRNA的5,端开始降解时,其3,端部分仍在合成或被翻译。mRNA降解的速度大概是转录或翻译速度的一半。因为基因转录和多链肽延伸的速度基本相同,所以细胞内某一基因产物(蛋白质)的多少决定于转录和翻译的起始效率,以大肠杆菌色氨酸合成酶基因为例,平均每分钟约有15次转录起始,这些mRNA链从生成到降解平均被翻译10次,所以,稳定状态下细胞中每分钟生成150个多肽。在讨论mRNA半衰期的时候我们不应忘记,所有这一切都只是统计学上的平均值。事实上,新生mRNA与成熟mRNA受核酸酶”攻击”的概率是相等的。所以,有些mRNA链可能被翻译了许多次,而同一群体中的另外一些mRNA分子可能根本没有被翻译。虽然mRNA的寿命具有随机性,但某一mRNA的翻译产量却是大致稳定的。•80-3生物信息的传逮(上)——从DNAHRNAI第二个编码区起始(»)C±>a第一个■西区|CD终止——第一个♦码区I第二个编码区终止/M始图3-12原核生物多K反子基因中后续编码区U课起始受K反子之间距离的(«)当两个离反子之间赖较近时而一履反子翻译的终止与后一顺反子用译的起始是相互投立世(b)当两个题反子之间距离较近时M—项反于翻译的终止与后一膜反子翻译的
442、许多原核生物mRNA以多顺反子的形式存在:细菌mRNA可以同时编码不同的蛋
45白质。编码多个蛋白质的mRNA为多顺反子mRNA。多顺反子mRNA是一组相邻基因的转录产物。这一组基因被称为一个操纵子。单顺反子mRNA为只编码一个蛋白质的mRNAo操纵子是生物体内的重要遗传单位。如大肠杆菌乳糖操纵子转录成编码3条多肤的多顺反子mRNA,经过翻译生成B-半乳糖昔酶、透过酶及乙酰基转移酶。几乎所有mRNA都可以被分成3部分:编码区、位于AUG之前的5,端上游非编码区以及位于终止密码子之后不翻译的3'端下游非编码区。编码区从起始密码子AUG开始,经一连串编码氨基酸的密码子直至终止密码子。对于第一个顺反子来说,一旦mRNA的5'端被合成,翻译起始位点即可与核糖体相结合,而后面几个顺反子翻译的起始就会受其上游顺反子结构的调控。一种情况是,第一个蛋白质合成终止以后,核糖体分解成大、小亚基,脱离mRNA模板,第二个蛋白的翻译必须等到新的小亚基和大亚基与该蛋白起始密码子相结合后才可能开始(图3-12a).当然,前一个多肽翻译完成以后,核糖体大、小亚基分离,小亚基也可能不离开mRNA模板,而是迅速与游离的大亚基结合,启动第二个多肽的合成(图3-12b)。在噬菌体RNA中,一个顺反子的翻译有时完全取决于它前面顺反子的翻译,因为噬菌体RNA往往形成复杂的二级结构,只有第一个翻译起始位点是暴露的,在这个顺反子翻译产生多肽的过程中,核糖体的运动破坏了后续顺反子的二级结构,使起始位点较容易与核糖体相结合形成起复合物(图3-13).3、原核生物mRNA的5,无帽子结构,3,端无或者只有较短的poly(A)结构3.3.2真核生物mRNA的特征凡是编码功能蛋白的真核基因都通过RNA聚合酶II进行转录,真核基因几乎都是单顺反子,只包含一个蛋白质的信息,其长度在几百到几千个核甘酸之间。一个完整的基因,不但包括编码区(codingregion),还包括5,和3,端长度不等的特异性序列,它们虽然不编码氨基酸,却在基因表达的过程中起着重要作用。所以,”基因”的分子生物学定义是:产生一条多肽链的功能RNA所必需的全部DNA核昔酸序列!真核生物mRNA结构上的最大特征是5,端的帽子及3,的poly”(A)结构。mTOwN.N.善・■区法愿不一AUO0码区几百一几千・UGAUAGUAA备■四区1QO-2SO■poly(A)■幢生物mRNA的"。子.岫修IW3-IS*植生物mRNAtaw1•真核生物mRNA的5,端存在“帽子“结构真核生物的mRNA(不包括叶绿体和线粒体)5'端都是经过修饰的,基因转录一般从噂吟(主要是A,也可能是G)起始,第一个核昔酸保留了5'端的三磷酸基团并能通过其3,-OH位与下一个核昔酸的5'磷酸基团形成二酯键,转录产物的起始序列为pppApNpNp……然而,如果在体外用核酸酶处理成熟mRNA;其5,端并不产生预期的核昔三磷酸,而产生以5'f5'三磷酸基团相连的二核昔酸,5'终端是一个在mRNA转录后加上去的甲基化鸟嚓吟(图3-15)。mRNA5,端加“G”的反应是由腺甘酸转移酶完成的,这个反应非常迅速,很难测得5'自由三磷酸基团的存在。据测算,在新生mRNA链达到50个核甘酸之前,帽子结构就已加到mRNA的第一个核甘酸上了。即mRNA几乎一诞生就是戴上帽子的。新加上的G与mRNA
46链上所有其他核酸昔方向正好相反,像一顶帽子倒扣在mRNA链上。mRNA的帽子结构常常被甲基化。第一个甲基出现在所有真核细胞的mRNA中(单细胞真核生物mRNA主要是这个结构),由尿甘酸-7-甲基转移酶催化,称为零号帽子(cap。)。帽子结构的下一步是在第二个核甘酸(原mRNA5,第一位)的2,-OH位上加另一个甲基,这步反应由2M-甲基转移酶完成。一般把有这两个甲基的结构称为1号帽子(capl),真核生物中以这类帽子结构为主。当mRNA原第二位核昔酸是腺噂吟时,其M位有时也被甲基化,这一反应只能在2、OH被甲基化以后才能发生。在某些生物细胞内,mRNA链上的第三个核昔酸的2-OH位也可能被甲基化,因为这个反应只以带有1号帽子的mRNA为底物,所以被称为2号帽子(cap2)。有2号帽子的mRNA只占有帽mRNA总量的10%,15%以下。帽子结构使mRNA免遭核酸酶的破坏。实验表明,去除珠蛋白mRNA5,端的7.甲基鸟啜吟后,该mRNA分子的翻译活性和稳定性都明显下降。而且,有帽子结构的mRNA更容易被蛋白质合成的起始因子所识别,从而促进蛋白质的合成.在呼肠孤病毒中,含甲基化5,端mRNA的蛋白质合成速度比不含甲基的mRNA要快。用化学方法除去5,端的甲基以后,上述mRNA作为蛋白质合成模板的活性消失,说明mRNA5,端甲基化的帽子是翻译所必须的。己经发现在呼肠孤病毒中无m7G的mRNA不能与核糖体40S小亚基结合,证明甲基化的帽子结构可能是蛋白质合成起始信号的一部分。2继大多数真核生物mRNA具有poly(A)尾巴除组蛋白基因外,真核生物mRNA的3,末端都有poly(A)序列,其长度因mRNA种类不同而变化,一般为40〜200个。poly(A)序列是在转录后加上去的,可能在细胞核中的不均一核RNA阶段就已经加上了poly(A).目前还不清楚RNA聚合酶H所转录基因的精确终止位点,但研究发现,几乎所有真核基因的3,末端转录终止位点上游15〜30bp处的保守序列AAUAAA对于初级转录产物的准确切割及加poly(A)是必需的(图3-16)。实验证明,尽管poly(A)位点及AATAAA的存在对于基因的转录和成熟意义重大,但RNA聚合酶II却不在poly(A)位点终止,而往往继续转录,因此,大部分已知基因的初级转录产物拥有poly(A)位点下游0.5〜2kb核昔酸序列。加poly(A)时需要由内切酶切开mRNA3,端的特定部位,然后由poly(A)合成酶催化多聚腺昔酸的反应。如果将上述保守序列切除,该基因组合的转录活性就会消失。点突变实验将AAUAAA变为AAGAAA,虽然维持了该基因的转录活性,却发现mRNA的剪接加工受阻,因而没有功能性mRNA产生。mRNA**体5-AAUAXACAOU1鲤介切3-16在核生恤mHNA中的加,・A反应
47poly(A)是mRNA由细胞核进入细胞质所必需的形式,它大大提高了mRNA在细胞质中的稳定性。当mRNA刚从细胞核细进入胞质时,其poly(A)尾巴一般比较长,随着mRNA在细胞质内逗留时间延长,poly(A)逐渐变短消失,mRNA进入降解过程。真核生物mRNA大都具有poly(A)尾巴,这一特性已被广泛应用于分子克隆。常用寡聚dT片段与mRNA上的poIy(A)相配对,作为反转录酶合成第一条cDNA链的引物。尽管大部分真核mRNA有poly(A)尾巴,细胞中仍可有多达1/3没有poly(A)的mRNA,我们把带有poly(A)的mRNA称为poly(A)+,而把没有poly(A)的mRNA称为poly(A),,约1/3的poly(A)"mRNA编码了不同形式的组蛋白,其余2/3的poly(A)mRNA可能带有与poly(A)+组分相同的遗传信息。3.4终止一般情况下,RNA聚合酶启始基因转录后,它就会沿着模板5,一3,方向不停地移动,合成RNA链,直到碰上终止信号时才与模板DNA相脱离并释放新生RNA链。终止发生时,所有参与形成RNA-DNA杂合体的氢键都必须被破坏,模板DNA链才能与有意义链重新组合成DNA双链。3-4-1由基因序列决定的终止现已查明,模板DNA上存在终止转录的特殊信号一一终止子,每个基因或操纵子都有一个启动子和一个终止子。终止位点上游一般存在一个富含GC碱基的二重对称区,由这段DNA转录产生的RNA容易形成发卡式结构。在终止位点前面有一段由4〜8个A组成的序列,所以转录产物的3,端为寡聚U,这种结构特征的存在决定了转录的终止。在新生RNA中出现发卡式结构会导致RNA聚合酶的暂停,破坏RNA-DNA杂合链5,端的正常结构。寡聚U的存在使杂合链的3,端部分出现不稳定的rU-dA区域。两者共同作用使RNA从三元复合物中解离出来(图3-17).终止效率与二重对称序列和寡聚U的长短有关,随着发卡式结构(至少6bp)和寡聚U序列(至少4个U)长度的增加,终止效率逐步提高。元转录复合物中解离出来,从而终止转录。DNACOGTAduuuuuuuuuu-RNADNA3.4.2依赖于P因子的终止
48体外转录实验表明,纯化的RNA聚合酶并不能识别特异性的转录终止信号,而加入大肠杆菌P因子后该聚合酶就能在DNA模板上准确地终止转录。p因子是一个相对分子质量为2.0x105的六聚体蛋白,它能水解各种核昔酸三磷酸,实际上是一种NTP酶,它通过催化NTP的水解促使新生RNA链从三元转录复合物中解离出来,从而终止转录。依赖于P因子的转录终止区DNA序列缺乏共性,说明该因子并不能识别这些终止位点。现在一般认为,RNA合成起始以后,P因子即附着在新生的RNA链上,靠ATP水解产生的能量,沿着5,f3,方向朝RNA聚合酶移动,到达RNA的3MJH端后取代了暂停在终止位点上的RNA聚合酶,使之从模板DNA上释放mRNA,完成转录过程(图3/8)。RNA聚合鼻沿模板移动P因子依附在RNA链的5'端P因子沿RNA链运动,跟踪聚合・P因子赶上在终止位点技停的聚合II图3-18p因子参与的RNA合成终止模式3-5内含子的剪接、编辑及化学修饰3•5•1RNA中的内含子断裂基因的存在表明真核细胞的基因结构和mRNA合成过程比原核细胞要复杂得多,因为真核基因表达往往伴随着RNA的剪接过程(splicing),从mRNA前体分子中切除被称为内含子(intron)的非编码区,并使基因中被称为外显子(exon)的编码区拼接形成成熟mRNA。真核基因大多是断裂的,也就是说,一个基因可由多个内含子和外显子间隔排列而成。内含子在真核基因中所占的比例很高,甚至超过99%。«3-7部分人类工因中内含于序列所占的比麓分析基因长度/kb内含子数量内含子所占比例/%胰岛索1.4267B-球蛋白L4269血清蛋白181389胶原蛋白组分崛3J11771亚因子1862595萎缩性肌强直因子240078>99
493.5内含子的翦捶、塘辑及化学修饰•89•图3-20用DNA-RNA杂交的方法验证碍卵消武白基因中存在非编玛的内含于区(a)成熟mRNA与带有该基因的互补链DNA序列杂交示意图“b)鸡卵清蛋白的基因结构示套图.L及1-7区表示外显子区,A-G为内含于区由DNA转录生成的原始转录产物核不均一RNA(hnRNA,heterogeneousnuclearRNA),即mRNA的前体,经过守加“帽”和3,酶切加多聚腺甘酸,再经过RNA的剪接,编码蛋白质的外显子部分就连接成为一个连续的可读框(openreadingframe,ORF),通过核孔进人细胞质,作为蛋白质合成的模板。表3-8和图3-21分别总结了原始RNA成熟期间的图3-21原始转录产物的生成及其主要加工剪接过程图示真核基因平均含有8个内含子,前体分子一般比成熟mRNA大4〜10倍。不同生物细胞内含子的边界处存在相似的核昔酸序列,表明内含子剪接过程在进化上是保守的。表3-9总结了存在于生物体内的各种内含子,其中GU-AG或AU-AC分别代表了不同内含子的5,和3,边界序列,GU-AG是主要的,AU-AC是次要的。除了边界序列之外,外显子与内含子交界处的序列以及内部的部分序列都有可能参与内含子的剪接(图3-22)o
503•5•2RNA的剪接许多分子质量较小在106〜185bp之间的核内RNA(如ULU2,U4,U5和U6)以及与这些RNA相结合的核蛋白(被称为snRNPs,ribonucleoproteinparticle)参与RNA的剪接。mRNA链上每个内含子的5,和3,端分别与不同的snRNP相结合,形成RNA和RNP复合物(图3-23)o一般情况下,由UIsnoRNA以碱基互补的方式识别mRNA前体5,剪接点,由结合在3,剪接点上游富嗑咤区的U2AF(U2auxiliaryfactor)识别3,剪接点并引导U2snRNP与分支点相结合,形成剪接前体(Pwspliceosome),并进一步与U4、U5、U6snRNP三聚体相结合,形成60S的剪接体(spliceosome),进行RNA前体分子的剪接。(•)前体mRNAy剪接位点相邻的保守序列3,剪接位点相邻的保守序列5,-AO|OUAAGU-3,51-PyPyPyPyPyPyNCAG|-3r(b)U2AF»剪接前体1’U2-*nRNP图3-23真核生物mRNA前体中内含f剪接过程示意图图3-22脊椎动物前体mRNA中常见内含子剪接所必需的保守序列
51哺乳动物细胞中,mRNA前体上的snRNP是从5,向下游“扫描”,选择在分支点富喀咤区3,下游的第一个AG作为剪接的3,受点。AG前一位核昔酸可以影响剪接效率,一般说来,CAG=UAG>AAG>GAG«如果mRNA前体上同时存左几个AG,可能发生剪接竞争。与前面所述的mRNA前体中主要(GU-AG类)和次要(AU-AC类)内含子的剪接方式不同的是I、II类内含子,因为带有这些内含子的RNA本身具有催化活性,能进行内含子的自我剪接。在I类内含子切除体系中,鸟昔或鸟昔酸的3-OH作为亲核基团攻击内含子51端的磷酸二酯键,从上游切开RNA链。再由上游外显子的自由3'-OH作为亲核基团攻击内含子3,位核昔酸上的磷酸二酯键,使内含子被完全切开,上下游两个外显子通过新的磷酸二酯键相连。在II类内含子切除体系中,内含子本身的某个腺昔酸2-OH作为亲核基团攻击内含子5,端的磷酸二酯键,从上游切开RNA链后形成套索状结构。再由上游外显子的自由3、OH作为亲核基团攻击内含子3,位昔上的磷酸二酯键,使内含子被完全切开,上下游两个外显子通过新的磷酸二酯键相连。原始转录产物yU-OH与3,末端相连--3,.:套索状结构中的朦昔酸带和个・内含子本身的某个腺甘酸2:0H作为亲核基团攻击内含子5,端的磷酸二酯健RNA剪接产物5'上游外显子的3「0H作为亲核基团攻击内含子3,位核甘酸上的磷酸二酯键,使套索结构完全解离8H3,完成剪接的RNAy图3-26U类内含子的自我剪接过程3•5•3RNA的编辑和化学修饰根据中心法则,DNA、RNA和蛋白质之间存在着直接的线性关系,即连续的序列DNA被真实地转录成mRNA序列,然后翻译产生蛋白质分子。断裂基因的发现和RNA的剪接虽然使得基因表达过程增加了一个步骤,但DNA的实际编码序列没有发生变化。RNA的编辑(RNAediting)是某些RNA,特曝mRNA的一种加工方式,它导致了DNA所编码的遗传信息的改变,因为经过编辑的mRNA序列发生了不同于模板DNA的变化。
52哺乳动物载脂蛋白mRNA的编辑是广泛研究的典型例子,图3-27分别是该基因的DNA序列以及在哺乳动物肝脏和肠组织中分离到的mRNA序列。载脂蛋白基因编码区共有4563个密码子,在所有组织中其DNA序列都相同。在肝脏中,该基因转录产生完整的mRNA并被翻译成有4563个氨基酸的全长蛋白质,相对分子质量为5.1x10'。在肠中合成的却是只包含有2153个密码子的mRNA,翻译产生相对分子质量为ZSxlO,的蛋白质。研究发现,该蛋白其实是全长载脂蛋白的N端。它是由一个在序列上除了第2153位密码子从CAA突变为UAA之外完全与肝脏mRNA相同的核酸分子所编码的,C-U突变使编码谷氨酰胺的密码子变成了终止密码子。图3-27哺乳动物载脂蛋白基因转录产物的编辑核基因原始RNA原始RNA指导RNAmRNA指导RNAmRNA群山mRNA图3-28指导RNA和RNA的编辑机制除点突变之外,RNA编辑的另一种形式是尿甘酸的缺失和添加。研究发现,利什曼原虫属细胞色素bmRNA中含有许多独立于核基因的尿嗑咤残基,而特异性插入这些残基的信息来自指导RNA(即guideRNA),因为它含有与编辑后细胞色素bmRNA相互补的核昔酸序列。指导RNA与被编辑区及其周围部分核酸序列虽然有相当程度的互补性,但该RNA上存在一些未能配对的腺噂吟,形成缺口,为插入尿嗑咤提供了模板。反应完成后,指导RNA从mRNA上解离下来,而mRNA则被用做翻译的模板。AAAGOOGAGAGAAAAGAAAAGGCTTTAACTTCAOGTnjrTTCnACGAGl^IArGG#w*AAAGCX3QAGAGAAAAOAAAAOGCUUUAMXJUCAOOUUOUUUAUUAOQAGUAUAUQa除了RNA的编辑之外,有些RNA,特别是前体rRNA和tRNA,还可能有特异性化
53学修饰。图3-29是最常见的6大类化学修饰途径及其产物。修苴化IhfeM#化]率倒:“■岭去M君后成为次黄■岭用♦取代“基分于上的a*«:在彼伶♦的械上加一个或霎个一CHj举例:冬・冷甲苫化产物M’G[匚•tlfc环龄构上发生分子■代【EAFIZia用不拿她核普・替校常见核n"举例:充♦吟把一个二价■电和华例:二帆解吐听华例:*■«碇同分异构化生成做际*碇图3-29rRNA和tRNA分子中的核甘酸化学修饰RNA的化学修饰可能具有位点特异性。70〜100个核昔酸的核仁RNA(snoRNAs)参与RNA的化学修饰,因为这些RNA能通过碱基配对的方式,把rRNA分子上需要修饰的位点找出来(图3・30)。snoRNA上的D盒是甲基化酶的识别位点。)修饰的核昔酸3,rRNA5'snoRNA5^^AOAUCUUGGUOGUAysUCUAGAACCACUAU外3'图3-30酵母U24snoRNA指导的甲基化思考题:1、启动子的意义和序列特征。2、转录起始在转录过程中的重要性。第四章生物信息的传递(下)一一从mRNA到蛋白质教学内容:1、遗传密码;2、tRNA;3、核糖体;4、蛋白质合成的生物学机制;5、蛋白质运转机制。教学目的:使学生了解参与蛋白质合成的主要物质和蛋白质合成途径。
54教学重点:1、mRNA与氨基酸的的关系一一遗传密码;2、tRNA与mRNA的关系、tRNA与氨基酸的关系;3、核糖体;4、蛋白质合成的生物学机制;5,蛋白质运转机制。讲课具体内容蛋白质的生物合成是一个比DNA复制和转录更为复杂的过程。它包括:(1)翻译的起始核糖体与mRNA结合并与氨酰-tRNA生成起始复合物。(2)肽链的延伸由于核糖体沿mRNA5,端向3,端移动,开始了从N端向C端的多肽合成,这是蛋白质合成过程中速度最快的阶段。(3)肽链的终止及释放核糖体从mRNA上解离,准备新一轮合成反应。核糖体是蛋白质合成的场所,mRNA是蛋白质合成的模板,转移RNA(transferRNA,tRNA)是模板与氨基酸之间的接合体。在合成的各个阶段还有许多蛋白质、酶和其他生物大分子参与。蛋白质合成是一个需能反应,要有各种高能化合物的参与。在真核生物中有将近300种生物大分子与蛋白质的生物合成有关;细胞用来进行合成代谢的总能量的90%消耗在蛋白质合成过程中:参与蛋白质合成的各种组分约占细胞干重的35%。在真核生物细胞核内合成的mRNA,只有被运送到细胞质部分,才能翻译生成蛋白质。所谓翻译是指将mRNA链上的核昔酸从一个特定的起始位点开始,按每3个核甘酸代表一个氨基酸的原则,依次合成一条多肽链的过程。蛋白质合成速度很高。大肠杆菌只需要5s就能合成一条由100个氨基酸组成的多肽。4.1遗传密码一一三联子贮存在DNA上的遗传信息通过mRNA传递为蛋白质。mRNA上每3个核昔酸翻译成蛋白质多肽链上的一个氨基酸,这3个核昔酸称为密码,也叫三联子密码。翻译时从起始密码子AUG开始,沿着mRNA5,-3,的方向连续阅读密码子,直至终止密码子为止,生成一条具有特定序列的多肽链一一蛋白质。mRNA上的遗传密码三联于图4-1Crick关于tRNA分子破译mRNA遗传宙码三联子的原始构想.4,1•1三联子密码及其破译首先从数学的角度来考虑:mRNA中有4种核昔酸,蛋白质中有20种氨基酸,以一种核昔酸代表一种氨基酸则蛋白质中只能有4种氨基酸,不行。若以两种核甘酸作为一个氨基酸的密码(二联子),它们能代表的氨基酸只有42=16种,不足20种,也不行。而若以3个核昔酸代表一个氨基酸,则可以有43=64种密码,可以满足编码20种氨基酸的需要。在模板mRNA中插入或删除一个碱基,会改变该密码子以后的全部氨基酸序列。若同时对模板进行插入和删除试验,插入和删除的碱基数一样,后续密码子序列就不会变化,翻译得到的蛋白质序列就保持不变(除了发生突变的那个密码子所代表的氨基酸之外)。如果同时删去3个核甘酸,翻译产生少了一个氨基酸的蛋白质,但序列不发生变化。
55(*).入5*IgUAlGTTliu&A-cGG1KTJ13*(-).除5'[gua3ccu||acg-gA-U13'(J)(-)SaSiSmt5,1。UAlliGCIICAcfdGA1153,读码枢债震(-)(-)(-)一次■去y—4GUAll|I1UAcloGAllul3,湾码悔不支图4-2用核件酸的精人或■除实疆证明mRNA模板上卷3个核昔酸组成一个由玛子对烟草坏死卫星病毒的研究发现。其外壳蛋白亚基由400个氨基酸组成,而相应的RNA片段长约1200个核甘酸,与假设的密码三联子体系正好相吻合。在20世纪60年代,由于体外蛋白质合成体系的建立和核酸人工合成技术的发展,科学家花了几年时间破译了遗传密码,即确定了代表每种氨基酸的具体密码。4-1-2遗传密码的性质4•1•2•1密码的简并性按照1个密码子由3个核昔酸组成的原则,4种核昔酸可组成64个密码子,现在已经知道其中61个是编码氨基酸的密码子,另外3个即UAA、UGA和UAG并不代表任何氨基酸,它们是终止密码子,不能与tRNA的反密码子配对,但能被终止因子或释放因子识别,终止肽链的合成。密码子有61种而氨基酸只有20种.所以许多氨基酸有多个密码子,除色氨酸只有一个密码子(UGG)外,其他氨基酸都有一个以上的密码子,其中9种氨基酸有2个密码子,1种氨基酸有3个密码子,5种氨基酸有4个密码子,3种氨基酸有6个密码子。由一种以上密码子编码同一个氨基酸的现象称为简并(degeneracy),对应于同一种氨基酸的密码子称为同义密码子(synonymouscodon)。AUG和GUG既是met和val的密码子又是起始密码子。«4-3密码子的施井性密码7个败叔苓酸密码了个政内叙的4亮氟的66修氟的2天冬酰肢2甲硫氨敏1天冬新破2簟丙案限2半航砥触2蝴敏的4谷毓睢腋2”甄的6谷国修2苏也前4甘氢能4色双酸122耳亮—34同义密稿于■一般都不是随机分布的.因为其第一、第二位核甘酸往往是相同的.而第三位核"酸的改变并不一定影响所第g的挺精酸•这种安排减少了同义密码子第一、二第位核甘酸往往是相同的,而第三位核甘酸的改变不一定影响所编码的氨基酸。一般说来,编码某一氨基酸的密码子越多,该氨基酸在蛋白质中出现的频率也越高,但精氨酸是个例外,因为在真核生物中CG双联子出现的频率较低,所以尽管有6个同义密码子,蛋白质中精氨酸的出现频率仍不高。对同意密码的理解有助于PCR引物设计。
564.1.2.2密码的普遍性与特殊性以上介绍的密码子表是具有普遍性的,适用于一切生物。有一些特例,不编码普遍性状况应该编码的氨基酸而编码别的氨基酸,下表列举了一些特例。泰4-4线粒体与核DNA密码于使用情况的比较生物密码子线粒体DNA编码的氨基酸核DNA编码的氨基酸所有UGA色笈酸终止子薛母CUA苏氨酸亮氨酸果蝇AGA丝氨酸精氨酸哺乳类AGVG终止于精氨酸喃乳类AUA甲虢氨酸异亮氨酸4.1.2.3密码子与反密码子的相互作用4•1,2•3密码子与反密码子的相互作用在蛋白质生物合成过程中,tRNA的反密码子在核糖体内是通过碱基的反向配对与mRNA上的密码子相互作用的。T(33O-C-IG-C-J.O-C-£<59富・子(S9C-O-AC-G-UC-6-C(3*)123123I23(b)图4-4mRNA上的密码子与tRNA上的反密码子配对示意图(«)密码子与tRNA反密码子胃上相应序列配对;(b)当反密码子第一位是I时•宙码子第三位可以是A、U或C在密码子与反密码子的配对中,前两对严格遵守碱基配对原则,第三对碱基有一定的自由度,可以“摆动”,因而使某些tRNA可以识别1个以上的密码子。一个tRNA究竟能识别多少个密码子是由反密码子的第一位碱基的性质决定的,反密码子第一位为A或C时只能识别1种密码子,为G或U时可以识别2种密码子,为I时可识别3种密码子(表4-5)o«4-5tRNA上的反宙码子与mRNA上密码子的配对与“摆动”分析1.反密码子第一位是c或A时,只能识别一种密码子反密码子宙码子(3,)X-Y-C(5。(S9Y-X-GO*)(3,)X-Y-A(5‘)(5')Y-X-U(3‘)2.反密码孑第一位是U或G时,可分别识别两种密码子反密码子密码子(3*)X-Y-U(5‘)(S')Y-X-A/G(3‘)(3r)X-Y-G(5r)(5*)Y-X-C/U(3,)3.反密码子第一位是I时.可识别3种密码子反密码子密码子(3*)X-Y-1(5')(5r)Y-X-A/U/C(3r)如果有几个密码子同时编码一个氨基酸,凡是第一、二位碱基不同的密码子都对应于各自独立的tRNA。原核生物中大约有30〜45种tRNA,真核细胞中可能存在50种tRNA。4•2tRNAtRNA在蛋白质合成中为每个三联密码子翻译成氨基酸提供了接合体,为准确无误地
57将所需氨基酸运送到核糖体上提供了运送载体,它又被称为第二遗传密码。各种tRNA在结构上存在大量的共性。由于小片段碱基互补配对,形成三叶草形的二级结构。三叶草形tRNA分子上有4条根据它们的结构或已知功能命名的手臂:受体臂(acceptorarm),主要由链两端序列碱基配对形成的杆状结构和3,端未配对的3〜4个碱基所组成,其3,端的最后3个碱基序列永远是CCA,最后一个碱基的3,或2咱由短基(-0H)可以被氨酰化。其余手臂均由碱基配对产生的杆状结构和无法配对的套索状结构所组成,TWC臂是根据3个核昔酸命名的,其中W表示拟尿嗑碇,是tRNA分子所拥有的不常见核甘酸。反密码子臂是根据位于套索中央的三联反密码子命名的。D臂是根据它含有二氢尿嗑庭(dihydrouracil)命名的。最常见tRNA分子有76个碱基,相对分子质量约为2.5X10"。各种tRNA分子在74〜95个核甘酸的范围。tRNA分子长度的不同主要是由其中的两条手臂引起的,在D臂中存在多至3个可变核甘酸位点,包括17:1(位于第17和18核甘酸之间)及20:1、20:2位于第20和21核昔酸之间)。最常见的D臂缺失这3个核昔酸,而最小的D臂中第17位核昔酸也缺失了°tRNA分子中最大的变化发生在位于神C和反密码子臂之间的多余臂(extraarm)上。根据多余臂的特性,又可以将tRNA分为两大类:第一类tRNA占所有tRNA的75%,只含有一条仅为3〜5个核酸的多余臂;第二类tRNA含有一条较大的多余臂,包括杆状结构上的5个核甘酸和套索结构上的3〜11个核昔酸。多余臂的生物学功能尚不清楚。tRNA的稀有碱基含量非常丰富,约有70余种。每个tRNA分子至少含有2个稀有碱基,最多有19个,多数分布在非配对区,特别是在反密码子3,端邻近部位出现的频率最高,且大多为噪吟核甘酸,这对于维持反密码子环的稳定性及密码子、反密码子之间的配对是很重要的。基因组研究发现,原核生物与真核生物细胞中所拥有的各种tRNA基因总数很不一样。所有的tRNA都能够与核糖体的P位点和A位点结合,此时,tRNA分子三叶草形顶端突起部位通过密码子:反密码子的配对与mRNA相结合,而其3’末端恰好将所运转的氨基酸送到正在延伸的多肽上。此外,所有tRNA(除了起始tRNA夕卜)都能被翻译辅助因子EF-1U或eEFI所识别而与核糖体相结合,起始tRNA能被IF-2或elF—2所识别。4.2.1tRNA的L形三级结构tRNA的三级结构,都呈L形折叠式,而这种结构是靠二级结构中未配对碱基间所形成的氢键来维持的。tRNA的三级结构与氨酰-tRNA合成酶对tRNA的识别有关。受体臂和TWC臂的杆状区域构成了第一个双螺旋,D臂和反密码子臂的杆状区域形成了第二个双螺旋。TWC臂和D臂的套索状结构位于“L”的转折点。所以,受体臂顶端的碱基位于“L”的一个端点,反密码子臂的套索状结构生成了“L”的另一个端点。
58TVCft氟斗♦啜体0(■)(b)-6醉母tRNA一的二级结构示意图《根据X-射线怖射数据给制)《•)和(b)表示用不同方法构建的模型tRNA高级结构上的特点为我们提供了研究其生物学功能的重要线索,因为tRNA上所运载的氨基酸必须靠近位于核糖体大亚基上的多肽合成位点,而tRNA上的反密码子必须与小亚基上的mRNA相配对,所以分子中两个不同的功能基团是最大限度分离的。这个结构形式很可能满足了蛋白质合成过程中对tRNA的各种要求而成为tRNA的通式,研究证实tRNA的性质是由反密码子而不是它所携带的氨基酸所决定的。4•2•2tMA的功能转录:DNAfRNA;结构上相似;碱基配对;一对一。翻译:mRNAf蛋白质;结构极不相同;复杂。信息是以能被翻译成单个氨基酸的三联密码子形式存在的,在这里起作用的是tRNA的解码机制。氨基酸本身不能识别密码子,通过下列步骤来达到识别密码子并结合到多肽链的适当位置的:氨基酸在合成蛋白质之前先通过AA-tRNA合成酶活化,在消耗ATP的情况下结合到tRNA上,生成有蛋白质合成活性的AA-tRNA,由AA-tRNA上的反密码子与mRNA上的密码子相互识别并配对,将AA带到mRNA-核糖体复合物上,插入到正在合成的多肽链的适当位置上.将[14C]-Cys-tRNACys,经Ni催化生成严C]-Ala-tRNA“,SiE[,4C]-Ala-tRNAc,s加进含血红蛋白mRNA的兔网织细胞核糖体的蛋白质合成系统中,结果发现严C]-Ala-tRNA”插入了血红蛋白分子通常由半胱氨酸占据的位置上,这表明在这里起识别作用的是tRNA而不是氨基酸。4•2•3tRNA的种类1恋始tRNA和延伸tRNA有一类能特异地识别mRNA模板上起始密码子的tRNA叫起始tRNA,堤tRNA统称为延伸tRNA。原核生物起始tRNA携带甲酰甲硫氨酸(det),真核生物起始tRNA携带甲硫氨酸(Met)。原核生物中Met-tRNA'”必须首先甲酰化生成fMet一tRNAmkt才能参与蛋白质的生物合成。2•同工tRNA一种氨基酸可能有多个密码子,代表一种氨基酸的多个tRNA以不同的反密码子为特征,从而可以识别mRNA上代表一种氨基酸的多个密码子。几个代表相同氨基酸的tRNA称为同工tRNA。在一个同工tRNA组内,所有tRNA均专一于相同的氨酰-tRNA合成酶,即在一个同工tRNA组内tRNA只专一地结上一种氨基酸。同工tRNA既要有不同的反密码子以识别该氨基酸的各种同义密码,又要有某种结构上的共同性,能被特异的AA-tRNA合成酶识别。所以说,同工tRNA组内肯定具备了足以区分其他tRNA组的特异构造,保证合成酶能准确无误地加以选择。tRNA的二级和三级结构对它的专一性起着举足轻重的作用。3•校正tRNA1、无义突变的校正tRNA:在蛋白质的结构基因中,一个核苦酸的改变使代表某个氨基酸的密码子变成终止密码子(UAG、UGA、UAA),使蛋白质合成提前终止,合成无功能的或无意义的多肽,这种突变称为无义突变。无义突变的校正tRNA可通过改变其反密码子区校正无义突变而依然合成原氨基酸。褰4-7大崎杵苒无义突变的校正tRNA位点tRNA野生型校正基因火则南科反密码反密码
59•upDSerUCGCGAUAG♦—CUA•upEGinCAG^―cueUAG♦—CUAsupCTyrUACGUAUAGCUA•upGLy.AAAuuuUAAUUA•upUTrpUGGCCAUGAUCA2、错义突变的校正tRNA错义突变是由于结构基因中某个核昔酸的变化使一种氨基酸的密码变成另一种氨基酸的密码。错义突变的校正tRNA通过反密码子区的改变把正确的氨基酸加到肽链上,合成正常的蛋白质。如某大肠杆菌细胞色氨酸合成酶中的一个甘氨酸密码子GGA错义突变成AGA(编码精氨酸),指导合成错误的多肽链。甘氨酸校正tRNA的校正基因突变使其反密码子从CCU变成UCU,它仍然是甘氨酸的反密码子但不结合GGA而能与突变后的AGA密码子相结合,把正确的氨基酸(甘氨酸)放到AGA所对应的位置上。无义突变的校正tRNA必须与释放因子竞争识别密码子;错义突变的校正tRNA必须与该密码的正常tRNA竞争。这些都会影响校正的效率。所以,某个校正基因的效率不仅决定于校正tRNA的反密码子与密码子的亲和力,也决定于该校正tRNA在细胞中的浓度及竞争中的其他参数。一般说来,校正效率不会超过50%。无义突变的校正基因tRNA不仅能校正无义突变,也会抑制该基因3'末端正常的终止密码子,导致翻译过程的通读,合成更长的蛋白质,这种蛋白质过多就会对细胞造成伤害。同样,一个基因错义突变的校正也可能使另一个基因错误翻译,因为如果一个校正基因在突变位点通过取代一种氨基酸的方式校正了一个突变,它也可以在另一位点这样做,从而在正常位点上引入与前述突变位点对应的氨基酸,造成错误。2•2«4氨酰-tRNA合成酶氨酰-tRNA合成酶是一类催化氨基酸与tRNA结合的特异性酶,其反应式如下:AA+tRNA+ATP-AA-tRNA+AMP+PPi它实际上包括两步反应:第一步是氨基酸活化生成酶-氨酰腺昔酸复合物。AA+ATP+酶(E)-E-AA-AMP+PPi第二步是氨酰基转移到tRNA3'末端腺昔残基的2'或3'一羟基上。E-AA-AMP+tRNA-AA-tRNA+E+AMP蛋白质合成的真实性主要决定于tRNA能否把正确的氨基酸放到新生多肽链的正确位置上,而这一步主要决定于AA-tRNA合成酶是否使氨基酸与对应的tRNA相结合。AA-tRNA合成酶既要能识别tRNA,又要能识别氨基酸,它对两者都具有高度的专一性。不同的tRNA有不同的碱基组成和空间结构,易被酶所识别:比较困难的是这些酶识别结构上非常相似的氨基酸。例如,异亮氨酸只比缀氨酸多一个甲烯基团,而异亮氨酰-tRNA合成酶对异亮氨酸的亲和力比对缀氨酸大225倍。考虑到体内缀氨酸的浓度比异亮氨酸高5倍,缀氨酸被错误活化渗到入异亮氨酸位点上去的几率应是1/40,但实际上错误频率(误差率)只有约1/10000,表明还有其他的校正手段以增加蛋白质合成的真实性。有科学家发现,被错误活化的缀氨酸不会被结合到tRNA也上,而是被酶本身水解,即活化阶段产生的误差
60在后一阶段被再次校正了。衰4-8活化tRNA”合成酹的准•性受双・控制错误率编氨酸活化阶段1/225壕氨酰-tRNA"•的释放1/270总误差率1/225x1/270x5=1/120004-3核糖体生物细胞内,核糖体像一个能沿mRNA模板移动的工厂,执行着蛋白质合成的功能。它是由几十种蛋白质和几种核糖体RNA(ribosomalRNA,rRNA)组成的亚细胞颗粒。一个细菌细胞内约有20000个核糖体,而真核细胞内可达IO6个,在未成熟的蟾捺卵细胞内则高达10”个。这些颗粒既可以游离状态存在于细胞内,也可与内质网结合,形成微粒体。核糖体和它的辅助因子为蛋白质生物合成提供了必要的条件。运载有肽链起始或延伸必需氨基酸的AA-tRNA,往往以令人难以置信的速度进入核糖体,在起始或延伸因子的作用下,与mRNA模板和延伸中的肽链相互作用,卸去所载氨基酸后tRNA立即退出核糖体,以保证新一轮合成反应的顺利进行。核糖体蛋白约占原核细胞总蛋白量的10%,rRNA占细胞内总RNA量的80%(表4-9)。在真核细胞内,核糖体所占的比重虽然有所下降,但rRNA仍然占总RNA的绝大部分,核糖体蛋白是细胞总蛋白的一个重要组成部分。无论原核或真核细胞内核糖体的含量都是与细胞蛋白质合成活性直接相关的。表4-9核情体皆白及其他组分在大肠杆・细胞内的分布组分占细胞总量细胞内数量细胞壁10%.1细胞膜10%2DNA2%1mRNA2%3.5xlO5tRNA3%1.6xl05rRNA21%8xlO1核糖体蛋白9%2x104可溶性蛋白40%106小分子3%7.5xlO6在真核生物中,所有正在进行蛋白质合成的核糖体都不是在细胞质内自由漂浮,而是直接或间接与细胞骨架结构有关联或者与内质网膜结构相连的(图4-8).细菌核糖体大都通过与mRNA的相互作用,被固定在核基因组上。
61图4-8结合在内质网上的核糖体左,电镜下看到的胰腺细胞幡面内质网;右,局部放大后的草图•细胞质,内质网内腔核糖体包括两个亚基,大亚基约为小亚基相对分子质量的二倍。每个亚基包含一个主要的rRNA成分和许多不同功能的蛋白质分子,这些分子大都以单拷贝的形式存在。大亚基除了含有主要rRNA组分外,还有一些相对分子质量较小的RNA。核糖体亚基中的主要rRNA基因虽然有许多个拷贝,但其序列十分保守,暗示rRNA序列在组成功能核糖体的过程中有着重要的作用。表4-10是大肠杆菌核糖体的基本组成成分,从已知的大肠杆菌rRNA和蛋白质序列来看,细菌的核糖体是完全相同的。表4-1。大蹒杆首核糖体基本成分核糖体小亚基大亚基沉降系数70S3OS50S总体相对分子质母2.52X1069.30x10•3•1核糖体的结构核糖体是一个致密的核糖核蛋白颗粒,可以解离为大小两个亚基,大亚基约为小亚基相对分子质量的二倍。每个亚基都含有一个相对分子质量较大的rRNA和许多不同的蛋白质分子。这些大分子rRNA能在特定位点与蛋白质结合,从而完成核糖体不同亚基的组装。原核生物核糖体由约2/3的RNA及1/3的蛋白质组成。真核生物核糖体中RNA占3/5,蛋白质占2/5。原核生物、真核生物细胞质及细胞器中的核糖体存在着很大差异。1.59x106主要rRNA(碱基数)16S(1541)23S(2004)5S(120)RNA相对分子质量1.66x1065.60x10s1.10x10*RNA所占比例66%60%70%蛋百质数量/种2136蛋白质相对分子质量8.57x10'3.7OX1O54.87x105蛋白质所占比例34%40%30%
62«4-11几种不同生物核餐体及rRNA的组成核精体来源大亚基小亚基沉降系数RNA沉降系数RNA80S脊椎动物60S20-29S40S18S5S5.8S80S无脊椎动物、植物60S25S40S16-18S5S5.8S70S原核生物50S23S30S16S55S脊椎动物线粒体40S16-17S30S10-13S核糖体上有不止一个的活性中心,每一个这样的中心都由一组特殊的蛋白质构成。虽然有些蛋白质本身具有催化功能,但若将它们从核糖体上分离出来时,催化功能就会完全消失。所以,核糖体是一个许多酶的集合体,单个酶或蛋白只有在这个总体结构内才拥有催化性质,它们在这一结构中共同承担了蛋白质生物合成的任务。核糖体中许多蛋白质(可能还包括rRNA)的主要功能可能就是建立这种总体结构,使各个活性中心处于适当的相互协调的关系之中。已知大肠杆菌核糖体小亚基由21种蛋白质组成,分别用S1,……,表示,大亚基由36种蛋白质组成,分别用Ll……,L表示。真核生物细胞核糖体蛋白质中,大亚基含有49种蛋白质,小亚基有33种蛋白质,它们的相对分子质量在8x103〜4.0x10』之间。原植生物楼精体70S“,2.7X10°5SrRNA23SrRNA364冬白及■楂生物核・体80sA/.42X10*18SrRNA33♦♦蛋白厦*/r2?8X10*5SrRNA28SrRNA5.8SrRNA49种国门版对核糖体蛋白质的二级和三级结构也有不少研究。图4-9是在高倍电镜下得到的原核生物70S核糖体大、小亚基相结合的模型,核糖体分子可容纳两个tRNA和约40bp长的mRNAo&A/.0.9X10*16SrRNA21科*蛋臼摩图4-9核帕体结构模型及原核与度核细胞核慵体大小虫茎比较(・)电使数饰模式图。大笠玷位于强个分子的左便,细纯代袤mRNA,位于两个望基之向的是两个tRNA分子Mb)原核生物70s核第体(相对分子质蹴2.7x16)和真核生物80s核情体(相对分子般量4.2x10*)43.2rRNA1、5SrRNA细菌5SrRNA含有120个核甘酸(革兰氏阴性菌)或116个核昔酸(革兰氏阳性菌)。5SrRNA有两个高度保守的区域,其中一个区域含有保守序列CGAAC,这是与tRNA分子TwC环上的GTVCG序列相互作用的部位,是5SrRNA与tRNA相互识别的序列。另一个区域含有保守序歹!JGCGCCGAAUGGUAGU,与23SrRNA中的一段序列互补,这是5SrRNA与50s
63核糖体大亚基相互作用的位点,在结构上有其重要性。2、16srRNA其长度在1475-1544个核甘酸之间,含有少量修饰碱基。该分子虽然可被分成几个区,但全部压缩在30S小亚基内。16SrRNA的结构十分保守,其中3,端一段ACCUCCUUA的保守序列,与mRNA5,端翻译起始区富含嗯吟的序列互补。在16SrRNA靠近3,端处还有一段与23SrRNA互补的序列,在30S与50S亚基的结合中起作用。3、23srRNA23SrRNA的一级结构包括2904个核昔酸,在大肠杆菌23SrRNA第1984~2001核甘酸之间,存在一段能与tRNA'i“序列互补的片段,表明核糖体大亚基23srRNA可能与tRNA'i”的结合有关。在23SrRNA靠近5,端(143-157位核甘酸之间)有一段12个核甘酸的序列与5SrRNA上第72-83位核甘酸互补,表明在50S大亚基上这两种RNA之间可能存在相互作用。核糖体50S大亚基上约有20种蛋白质能不同程度地与23srRNA相结合。4、5.8SrRNA这是真核生物核糖体大亚基特有的rRNA,长度为160个核昔酸,含有修饰碱基。它还含有与原核生物5SrRNA中的保守序列CGAAC相同的序列,可能是与tRNA作用的识别序列,这说明5.8SrRNA可能与原核生物的5SrRNA具有相似的功能。索4-12人类基因组中主要rRNA甚因挖贝数分析rRNA基因预计拷贝数实际拷贝数相关基因拷贝数18S150-2000405.8S150~20011128S150-20001815S200〜30045205、18SrRNA酵母18SrRNA由1789个核昔酸组成,它的3,端与大肠杆菌16SrRNA有广泛的同源性。其中酵母18SrRNA、大肠杆菌16SrRNA和人线粒体12SrRNA在3’端有50个核昔酸序列相同。6、28SrRNA长度约在3890〜4500bp左右。从上述讨论中可以看出rRNA与tRNA及mRNA之间的相互关系,以及不同的rRNA之间的关系,这种关系是建立在序列互补或同源的基础之上的。4•3•3核糖体的功能核糖体存在于每个细胞中进行蛋白质的合成。尽管在不同生物体内其大小有别,但组织结构基本相同,而且执行的功能完全相同。
64图4TO"核生物细胞中发现的在多合肽成过程中,不同的tRNA将相应的氨基酸带到蛋白质合成部位,并与mRNA进行专一性的相互作用,以选择对信息专一的AA—tRNA。核糖体还必须能同时容纳另一种携带肽链的tRNA,即肽基-tRNA(Peptidyl-tRNA),并使之处于肽键易于生成的位置上。核糖体必须包括至少5个活性中心,即mRNA结合部位、结合或接受AA-tRNA部位(A位)、结合或接受肽基一tRNA的部位、肽基转移部位(P位)及形成肽键的部位(转肽酶中心)。此外,还应有负责肽链延伸的各种延伸因子的结合位点。核糖体小亚基负责对模板mRNA进行序列特异性识别,如起始部分的识别、密码子与反密码子的相互作用等,mRNA的结合位点也在小亚基上。大亚基负责携带氨基酸及tRNA的功能,肽键的形成、AA-tRNA、肽基-tRNA的结合等,A位、P位、转肽酶中心等主要在大亚基上。核糖体在体内及体外都可解离为亚基或结合成7OS/80s的颗粒。在翻译的起始阶段需要游离的亚基,随后才结合成70S/80s颗粒,开始翻译进程。大肠杆菌中的起始因子IF-3与小亚基结合,阻碍了后者与大亚基的结合,从而控制翻译起始过程。体外反应体系中,核糖体的解离或结合取决于离子浓度。在大肠杆菌内,Mg"浓度在10-%01/L以下时,70S解离为亚基,浓度达HTmol/L时则形成稳定的70s颗粒。mRNA链上一般每40个核甘酸有一个核糖体。肽链释放后,核糖体脱离mRNA解聚成亚基,直接参与另一轮蛋白质的合成,或两个亚基结合生成稳定的核糖体,不参与蛋白质合成。4.4蛋白质合成的生物学机制蛋白质是生物活性物质中最重要的大分子组分,生物有机体的遗传学特性要通过蛋白质来得到表达。蛋白质的生物合成包括氨基酸活化、肽链的起始、伸长、终止以及新合成多肽链的折叠和加工,现将各阶段的必需成分列于表4-13。
65阶段必需组分1.氨基峡的活化20种气基酸20种短酰-tRNA合成胸20种或更多的tRNAATP,Mg2,2.肽集的起始mRNAN-甲酰甲硫氨酰-tRNAmRNA上的起始密码子(AUG)核循体小亚基核精体大亚基GTP.Mg24起始因子(IF-】.IF-2.IF-3)3.肽链的延伸功能核精体(起始复合物)AA-lRNA伸长因子GTP.Mg1*肽基转移*4.肽链的终止ATPmRNA上的终止密码子样放因子(RF-l,RF-2.RF-3)5.折叠和加工参与起始氨基酸的切除、修饰等加工过程的乘4.4.1氨基酸的活化蛋白质合成的起始需要核糖体大、小亚基,起始tRNA和几十个蛋白因子的参与,在模板mRNA编码区5,端形成核糖体-mRNA-起始tRNA复合物并将甲酰甲硫氨酸放入核糖体P位点。原核生物的起始tRNA是fMet-tRNA™e,,而真核生物是Met-tRNAMc,«原核生物中30S小亚基首先与mRNA模板相结合,再与fMet-tRNA™“结合,最后与50s大亚基结合。而在真核生物中,40S小亚基首先与Met-tRNAM"相结合,再与模板mRNA结合,最后与60S大亚基结合生成80S•mRNA•Met-tRNAW,起始复合物。起始复合物的生成除了需要GTP提供能量外,还需要Mg?*、NHJ及3个起始因子(IF-1、IF-2、IF-3).起始因子与30s小亚基的结合较为松散,用Imol/LNH,Cl处理即可使之游离。蛋白质的生物合成是以氨基酸作为基本建筑材料的,且只有与tRNA相结合的氨基酸才能被准确地运送到核糖体中,参与多肽链的起始或延伸。表4-14是蛋白质中全部20种氨基酸的主要特征分析,而图441是这些氨基酸的结构式。表4-14,与・白厦合成的20种d修•主要特征分析氨基酸筒称相时分子质:■pi魂水性指出现频率葬极性带脂肪族R将团甘氨酸GlyG755.97-0.47.2丙氨酸AlaA896.011.87.8缰氨酸VaiV1175.974.26.6亮氨酸LeuL1315.983.89.i坤亮氨酸lieI13!6.024.55.3甲硫气酸MetM1495.74i.92.3带芳香族R茶团紫丙氨酸PheF1655.482.83.9酪氨酸TyrY1S15.66-1.33.2色气酸TrpW2045.89-0.91.4械性R基所呈中性丝氨酸Sers1055.68-0.86.8脯氨酸Prop1156.481.65.2苏气酸ThrT1195.87-0.75.9半胱气故CysC1215.072.51.9天冬睢胺AsnN1325.41-3.54.3答气鼠肢GinQ1465.65-3.54.2
66续表氨:基酸简称相对分子质量pl疏水性指数.出现频率R基团带正电荷赖组精氨氮氮酸酸酸Ly«K1469.74-3.95.9HisH1557.59-3.22.3ArgR17410.76-4.55.1AspD1332.77-3.55.4GluE1473.22-3.56.3R基团带负电荷天冬氨酸谷氨酸*负值表示亲水性,正值袅示威水性。作IB性,带腼肪袋R茶团coo-COO"HjN-C-HHjN-C-HHCHt甘氮酸内氨脾80HjN-C-H共CH>CH,芳香嫉R基的COO*COO-coo-HjN-C-HHjN-C-HHjN-C-H6◎CH,a荤丙色coo-♦IHjN-C-H横性,不用电荷的R基团coo-coo-coo-m5n-c-hHjN-C-HCHjOHHrC-QH帆CH,SH丝“酸苏塞,酸rutMttCOO-COO-COO-TH旷、泊HjC,"CHjHjN-C-HCHazcHjN-C-HCH,h2noHjNOMMiK天冬at艘谷氯联胺CH,CHa寇带负电荷的R草团coo'coo"HjN-C-HHjN-C-H飒coo天冬事.融谷气酸图4-1120种氟基酸的结构氨基酸必须在氨酰-tRNA合成酶的作用下生成活化氨基酸一一AA-tRNAo存在20种以上具有氨基酸专一性的氨酰一RNA合成酶,能够识别并通过氨基酸的竣基与tRNA3,端腺昔酸核糖基上3,一OH缩水形成二酯键。同一氨酰-tRNA合成酶具有把相同氨基酸加到两个或更多个带有不同反密码子tRNA分子上的功能。tRNA与相应氨基酸的结合是蛋白质合成中的关键步骤,只有tRNA携带了正确的氨基酸,多肽合成的准确性才有保障。在细菌中,起始氨基酸是甲酰甲硫氨酸;所以,与核糖体小亚基相结合的是N-甲酰甲硫氨酰-tRNA’M",可以与延伸中的Met-tRNA、'”区分开。真核生物中,任何一个多肽合成都是从生成甲硫氨酰一tRNAi'i"开始的,由于甲硫氨酸的特殊性,体内存在两种tRNAMe,0只有甲硫氨酰一tRNAp血能与40s小亚基相结合,起始肽链合成,普通tRNAH携带的甲硫氨酸只能被掺入正在延伸的肽链中。4.4.2翻译的起始细菌中翻译的起始需要如下7种成分:①30s小亚基,②模板mRNA,③fMet-tRNAmh",④3个翻译起始因子(IF-1、IF-2和IF-3),⑤GTP,⑥50s大亚基,⑦Mg?卡。翻译起始又可被分成3步(图4-12)。
67第一步,30S小亚基首先与翻译起始因子IF-1,IF-3结合,通过SD序列与mRNA模板相结合。第二步,在IF-2和GTP的帮助下,fMet-tRNAC进入小亚基的P位,tRNA上的反密码子与mRNA上的起始密码子配对。第三步,带有tRNA,mRNA,3个翻译起始因子的小亚基复合物与50S大亚基结合,GTP水解,释放翻译起始因子。n4-12flHf03*合5物栏皿30S亚基具有专一性的识别和选择mRNA起始位点的性质,而IF-3能协助该亚基完成这种选择。30S亚基通过其16SrRNA的3,端与mRNA5,端起始密码子上游碱基配对结合。所有原核生物mRNA上都有一个5'・AGGAGGU-3,序列,这个富噂吟区与30S亚基上16srRNA3'端的富喀碇区序歹|J5,・GAUCACCUCCUUA・3,相互补(图4・13)。(•)E.colitrpA(S')AOCACK;A*G(575AAAUCUGIAUGlGAACGCUAC(3*)E.coliaraBUUUGGAU/ClA(HUOAAAC0AUaGCGAUUGCAE.coliladCAAUUCAG-GUClG21GAAURFUdAAACCAOUA♦X174A蛋白AAUTUUIGOAElCUUUUUU(X,<3iGUUCGUUCU4♦菌体白AUGUAC2AAG6A66UIUGUftU(SGAACAACGCSD序列与16SrRNA站台起始密码子与fMet-tRNAi”相结合3'16SrRNA©g3'末端UCCUCCA(5r)GAUUCCUUU0ACCUIAUGCGAGCUUUUAOU(r)图4-13细mmRNA分子上往往存在一个与16SrRNAT端相互扑的SD序列各种mRNA的核糖体结合位点中能与16SrRNA配对的核甘酸数目及这些核甘酸到起始密码子之间的距离是不一样的,这反映了起始信号的不均一性。互补的核昔酸越多,30S亚基与mRNA起始位点结合的效率也越高。互补的核昔酸与AUG之间的距离也会影响mRNA-核糖体复合物的形成及其稳定性。细菌核糖体上一般存在3个与氨酰一tRNA结合的位点,即A位点(aminoacylsite),P位点(Peptidylsite)和E位点(exitsite).只有fMet-tRNAm,c*能与第一个P位点相结合,其他所有tRNA都必须通过A
68位点到达P位点,再由E位点离开核糖体。IF-2对于30S起始复合物与50S亚基的连接是必需的,IF-1在70S起始复合物生成后促进IF-2的释放,从而完成蛋白质合成的起始过程。真核生物蛋白质生物合成的起始机制与原核生物基本相同,其差异主要是核糖体较大,有较多的起始因子参与,其mRNA具有m7GpppNp帽子结构,Met-tRNA”“不甲酰化,mRNA分子5'端的“帽子”和3'端的多聚A都参与形成翻译起始复合物。首先,甲硫氨酰一tRNAi”“与40S小亚基相结合;接着核糖体上有专一位点识别mRNA的帽子,使mRNA与核糖体结合(图4-14)。帽子在mRNA与40S亚基结合过程中还起稳定作用。实验表明,带帽子的mRNA5,端与18SrRNA的3'端序列之间存在不同于SD序列的碱基配对型相互作用。40S起始复合物形成过程中有一种蛋白因子一一帽子结合蛋白(eIF4E),能专一地识别mRNA的帽子结构,与mRNA的5,端结合生成蛋白质-mRNA复合物,并利用该复合物对eIF-3的亲和力与含有eIF-3的40S亚基结合。除了识别帽子结构以外,40S小亚基还能识别mRNA上的起始密码子AUG。40s小亚基先结合在mRNA5,端的任何序列上,然后沿mRNA移动直至遇到AUG发生较为稳定的相互作用,最后与60S亚基一道生成80S起始复合物。40S小亚基之所以能在AUG处停下,是由于Met-tRNAiM”的反密码子与AUG配对的结果。起始过程中mRNA与40S小亚基结合时还需要ATP,因为蛋白质合成中消除mRNA二级结构是一个耗能过程,需由ATP水解提供能量。另外在40S亚基沿mRNA移动过程中也需要能量。编码区3'非编码区图4-14真核生物翻译起始复合物的形成4•4«3肽链的延伸生成起始复合物,第一个氨基酸(fMet/Met-tRNA)与核糖体结合以后,肽链开始伸长。按照mRNA模板密码子的排列,氨基酸通过新生肽键的方式(图4-15)被有序地结合上去。肽链延伸由许多循环组成,每加一个氨基酸就是一个循环,每个循环包括AA-tRNA与核糖体结合、肽键的生成和移位。
69Rd卜lfi4-J5多肽集上肤域的,修成SB合反应1,后续AA-tRNA与核糖体结合起始复合物形成以后,第二个AA-tRNA在延伸因子EF-1U及GTP的作用下,生成AA-tRNA•EF-TU-GTP复合物,然后结合到核糖体的A位上。这时GTP被水解释放,通过延伸因子EF-Ts再生GTP,形成EF-Th•GTP复合物,进人新一轮循环(图4-16)。模板上的密码子决定了哪种AA-tRNA能被结合到A位上。由于EF-Tu只能与fMet-tRNA以外的其他AA-tRNA起反应,所以起始tRNA不会被结合到A位上,这就是mRNA内部的AUG不会被起始tRNA读出,肽链中间不会出现fMet的原因。2、肽键的生成经过上一步反应后,在核糖体•mRNA・AA叫RNA复合物中,AA-tRNA占据A位,fMet-tRNA占据P位。在肽基转移酶(peptidyltransferase)的催化下,A位上的AA-tRNA转移到P位,与fMet-tRNA”"上的氨基酸生成肽键。起始tRNA在完成使命后离开核糖体P位点,A位点准备接受新的AA-tRNA,开始下一轮合成反应。(ifC7A「ffitCA<9A3•移位肽键延伸过程中最后一步反应是移位,即核糖体向mRNA3'端方向移动一个密码子(图4-18)。此时,仍与第二个密码子相结合的二肽基tRNA,从A位进入P位,去氨酰-tRNA被挤入E位,mRNA上的第三位密码子则对应于A位。EF-G是移位所必须的蛋白质因子,移位的能量来自另一分子GTP水解。
70「位点Alft点•«•«O»tSLtH(EFG介“gGTP水似eHZA3•4。族,力.f*肽-一”《ZA,宓住itt人"位.**“必a9fe«KtnMW核糖体沿mRNA移动与肽基-tNA的移位这两个过程是偶联的。肽链延伸是由许多个这样的反应组成的,原核生物中每次反应共需3个延伸因子一一EF-Tu、EF-Ts及EF-G;真核生物细胞需EF-1及EF-2,消耗2个GTP,向生长中的肽链加上一个氨基酸。4-4-4肽链的终止肽链的延伸过程中,当终止密码子UAA、UAG或UGA出现在核糖体的A位时,没有相应的AA-tRNA能与之结合,而释放因子能识别这些密码子并与之结合;水解P位多上多肽链与tRNA之间的二酯键。接着,新生的肽链和tRNA从核糖体上释放,核糖体大、小亚基解体,蛋白质合成结束。释放因子RF具有GTP酶活性,它催化GTP水解,使肽链与核糖体解离。细菌细胞内存在3种不同的终止因子(或称释放因子):RF1、RF2、RF3。RF1能识别UAG和UAA,RF2识别UGA和UAA.一旦RF与终止密码相结合,它们就能诱导肽基转移酶把一个水分子加到延伸中的肽链上。RF3可能与核糖体的解体有关。真核细胞只有一个(RF)终止因子.4.4.5蛋白质前体的加工新生的多肽链大多数是没有功能的,必须经过加工修饰才能转变为有活性的蛋白质。1.N端fMet或Met的切除细菌蛋白质N端的甲酰基能被脱甲酰化酶水解,不管是原核生物还是真核生物,N端的甲硫氨酸往往在多肽链合成完毕之前就被切除。有些动物病毒如脊髓灰质炎病毒的mRNA可翻译成很长的多肽链,含多种病毒蛋白,经蛋白酶在特定位置上水解后得到几个有功能的蛋白质分子。2.二硫键的形成mRNA中没有胱氨酸的密码子,而不少蛋白质都含有二硫键,这是蛋白质合成后通过两个半恍氨酸的氧化作用生成的。3.特定氨基酸的修饰氨基酸侧链的修饰作用包括磷酸化(如核糖体蛋白质)、糖基化(如各种糖蛋白)、甲基化(如组蛋白、肌肉蛋白质)、乙基化(如组蛋白)、羟基化(如胶原蛋白)和竣基化等。图4-20是生物体内最常见的被修饰的氨基酸残基及其修饰产物。糖蛋
71白主要是通过蛋白质侧链上的天冬氨酸、丝氨酸、苏氨酸残基加上糖基形成的,胶原蛋白上的脯氨酸和赖氨酸多数是轻基化的。内质网是蛋白质N-糖基化的主要场所。4、切除新生链中非功能片段新合成的胰岛素前体是前胰岛素原,必须先切去信号肽变成胰岛素原,再切去C-肽,才变成有活性的胰岛素(图4-23).不少多肽类激素和酶的前体也要经过加工才能变为活性分子,如血纤维蛋白原、胰蛋白酶原经过加工切去部分肽段才能成为有活性的血纤维蛋白、胰蛋白酶。蜂毒素能溶解动物细胞,也能溶解蜜蜂自身的细胞,所以只能在细胞内合成没有活性的前毒素,分泌进入刺吸器后,其N端的22个氨基酸残基被蛋白酶水解,生成有毒性的功能蛋白质(图4-24)。信号肽去“信号脓一国■的*a・5位点APEFEPAPEPEAEADAEADPEAGtOAVLKVLTTOLPAUISWIK.RK.RQQO24白R育经flt白Ml水**51N♦的22个恨*•以后才有生物活住该的外■白・只帼带异性切利X-Y2Ifco其中X是丙国取.天冬仪酷和谷CUK;Y墨内氯酸或*氟⑭1«4«6蛋白质合成抑制剂
72蛋白质生物合成的抑制剂主要是一些抗生素,此外还有核糖体灭活蛋白等都能抑制蛋白质的合成。这些抑制剂是治疗细菌感染的重要药物。抗菌素对蛋白质合成的作用:1、阻止mRNA与核糖体结合;2、阻止AA-tRNA与核糖体结合;3、干扰AA-tRNA与核糖体结合而产生错读;4、作为竞争性抑制剂抑制蛋白质合成。如链霉素是一种碱性三糖,能干扰fMet-tRNA与核糖体的结合,从而阻止蛋白质合成的正确起始,也会导致mRNA的错读。青霉素、四环素和红霉素只与原核细胞核糖体发生作用,从而阻遏原核生物蛋白质的合成,抑制细菌生长。氯霉素和噂吟霉素既能与原核细胞核糖体结合,又能与真核生物核糖体结合,妨碍细胞内蛋白质合成,影响细胞生长。因此,前3种抗生素被广泛用于人类医学,后两种则很少在医学上使用。氯霉素虽然有时也用于治病,但医生只在前几种抗生素均不见效时才使用,剂量和周期也控制较严。4.5蛋白质运转机制在生物体内,蛋白质的合成位点与功能位点常常被一层或多层细胞膜所隔开,这样就产生了蛋白质运转的问题。核糖体是真核生物细胞内合成蛋白质的场所,几乎在任何时候,都有数以百计或千计的蛋白质离开核糖体并被输送到细胞质、细胞核、线粒体、内质网和溶酶体、叶绿体等各个部分,补充和更新细胞功能。由于细胞各部分都有特定的蛋白质组分,因此合成的蛋白质必须准确无误地定向运送才能保证生命活动的正常进行。蛋白质是怎样从合成部位运送至功能部位的?它们又是如何跨膜运送的?跨膜之后又是依靠什么信息到达各自“岗位”的?对于膜蛋白来说,究竟是什么因素决定它是外周蛋白还是内在蛋白,是部分镶嵌还是跨膜分布,在膜的外侧还是内侧?这些都是十分有趣的问题,也是生物膜研究中非常活跃的领域(图4-27)。蛋白质运转可分为两大类:若某个蛋白质的合成和运转是同时发生的,则属于翻译运转同步机制;若蛋白质从核糖体上释放后才发生运转,则属于翻译后运转机制。这两种运转方式都涉及蛋白质分子内特定区域与细胞膜结构的相互关系。表4-15列举了跨膜运输和镶入膜内的几种主要蛋白质。从表中可知,分泌蛋白质大多是以翻译-运转同步机制运输的。在细胞器发育过程中,由细胞质进入细胞器的蛋白质大多是以翻译后运转机制运输的。而参与生物膜形成的蛋白质,则依赖于上述两种不同的运转机制镶入膜内。内。*4-15几类主要*白质的运转机制蛋白性质运转机制主要类型蛋白质在结合核物体上合成,并以免疫球蛋白、卵蛋白、水解酶、激素翻译-运转同步机制运输等蛋白质在游离核糖体上合成,以翻核、叶绿体、线粒体、乙醍酸循环细胞器发育译后运转机制运输体、过氧化物睥体等细胞器中的蛋白质_膜的形成两肿机制兼有慨网、类囊体中的吧质4.5.1翻译-运转同步机制蛋白质定位的信息存在于该蛋白质自身结构中,并且通过与膜上特殊受体的相互作用得以表达,这就是信号肽假说的基础。蛋白质跨膜运转信号是由mRNA编码的。信号肽紧接在起始密码之后,大部分是疏水氨基酸。信号肽的长度在13〜36个残基。有以下特点:1、10〜15个疏水氨基酸;2、N端有带正电荷的氨基酸;3、C端接近切割点处代数个极性氨基酸;4、C端氨基酸侧链短。
73切・但A人潭“・A量白MHU素”白Mecly»AbLnLttLe«VdU.LwlyrAhPUV«1AtoGl#A卬Gli-AhLevTrpMetAriLe.U.ProU«U-AhL«U»AJ.L«T«FOlyProAiphoAtaAtoAl.Pbe牛生长”M«MetAl.Ah3,MA"巾S"■5・。》AhL-35Leh»gThrCl»M«L”5VI:WOS叩»M-刈MMM巾AU***.一MeiLy»U»U.VUVHAl.WIteAl.Cj.U»IhOUHw*1.AriProAl«S«3,tc”W,-图4-28蛋白质通过其N端的信号肽在内质网中运转到不同的细胞器信号序列在结合核糖体上合成后便与膜上特定受体作用,产生通道,让多肽在延伸的同时穿过膜,这种方式是边翻译边跨膜运转。同细胞质中其他蛋白质的合成一样,分泌蛋白的生物合成开始于结合核糖体,当翻译进行到大约50〜70个氨基酸残基之后,信号肽开始从核糖体的大亚基露出,被粗糙内质网膜上的受体识别,并与之相结合。信号肽过膜后被内质网腔的信号肽酶水解,正在合成的新生肽随之通过蛋白孔道穿越疏水的双层磷脂。一旦核糖体移到mRNA的"终止”密码子,蛋白质合成即告完成,翻译体系解散,膜上的蛋白孔道消失,核糖体重新处于自由状态(图4-29).«■<-»*臼版唐膜运转的信号肽假说及其运*过程如果说信号序列在决定蛋白质的特定去向上起着指导作用,那么,信号肽在蛋白质运输过程中是如何起作用的呢?已知野生型细胞中叩一半乳糖酶定位于胞质内,麦芽糖结合蛋白定位于胞外,麦芽糖运转蛋白位于外膜内腔。如果把P-半乳糖酶竣基端基因片段与麦芽糖运转蛋白和麦芽糖结合蛋白的氨基端基因片段相连,并以此为模板指导合成杂种蛋白质,就可以通过测定P-半乳糖酶的活性确定杂种蛋白质在细胞内的位置。改变融合基因中编码麦芽糖运转蛋白氨基端的基因序列,得到了如下结论:(1)完整的信号多肽是保证蛋白质运转的必要条件。信号序列中疏水性氨基酸突变成亲水性氨基酸后,会阻止蛋白质运转而使新生蛋白质以前体形式积累在胞质中。(2)仅有信号肽还不足以保证蛋白质运转的发生。把麦芽糖运转蛋白中完整的、可水解的信号序列加到卜-半乳糖酶上,发现杂种蛋白质仍以前体形式留在胞质内。所以说,要使蛋白质顺利跨膜,还要求运转蛋白质在信号序列以外的部分有相应的结构变化。因此,科学家认为,指导蛋白质运转的信号事实上可能要长于被蛋白酶降解掉的信号肽链。(3)信号序列的切除并不是运转所必需的。如果把细菌外膜脂蛋白信号序列中的甘氨酸残基突变成天冬氨酸残基,则能抑制该蛋白信号肽的水解,但不能抑制其跨膜运转。
74(4)并非所有的运转蛋白质都有可降解的信号肽。卵清蛋白是以翻译-运转同步机制进入微粒体中的,但它并没有可降解的信号序列。有人认为,在卵清蛋白分子的中心区域有相当于信号肽功能的肽段存在。据此,"信号肽"应当定义为:能启动蛋白质运转的任何一段多肽。研究新生肽向内质网内腔运转过程发现,SRP(信号识别蛋白)和DP(停靠蛋白,又称SRP受体蛋白)介导了蛋白质的跨膜运转过程。SRP能同时识别正在合成需要通过内质网膜进行运转的新生肽和自由核糖体,它与这类核糖体上新生蛋白的信号肽结合是多肽正确运转的前提,但同时也导致了该多肽合成的暂时终止(此时新生肽一般长约70个残基左右)。SRP-信号肽-多核糖体复合物即被引向内质网膜并与SRP的受体一一DP相结合。只有当SRP与DP相结合时,多肽合成才恢复进行,信号肽部分通过膜上的核糖体受体及蛋白运转复合物跨膜进入内质网内腔,新生链肽重新开始延伸。整个蛋白跨膜以后,信号肽被水解,形成高级结构和成熟型蛋白质,并被运送到相应细胞器。SRP与DP的结合很可能导致受体聚集而形成膜孔道,使信号肽及与其相连的新生肽得以通过。此时,SRP与DP相分离并恢复游离状态。待翻译过程结束后,核糖体的大,小亚基解离,受体解聚,通道消失,内质网膜也恢复完整的脂双层结构(图4-30)。进入内质网内腔后,蛋白质常以运转载体的形式被送入高尔基体或形成运转小泡,分别运送到各自的亚细胞位点。图4-30新生蛋臼质通过同步转运途径进入内质网内腔的主要过程①核糖体组装、翻译起始;②位于量白质N端的信号肽序列首先被翻译;③SRP与核糖体、CTP以及带有信号肽的新生蛋白质相结合,历时中止肽惬延伸;④核脩体-SRP复合物与膜上的受体相结合;⑤GTP水解,野放SRP并进入新一轮循环;⑥肽链重新开始延伸并不断向内施运输;⑦信号肽被切除;⑧多肽合成结束,核糖体解离并恢复到黑评起始前的状态4.5.2翻译后运转机制叶绿体和线粒体中有许多蛋白质和酶是由细胞质提供的,其中绝大多数以翻译后运转机制进入细胞器内。4•5•2•1线粒体蛋白质跨膜运转线粒体是细胞的“动力站”,它虽然含有遗传物质(DNA、RNA)以及核糖体等等,但它的DNA信息含量有限,大部分线粒体蛋白质都是由核DNA编码的,在细胞质自由核糖体上合成,被释放至细胞质,再跨膜运转到线粒体各部分。与分泌蛋白质通过内质网膜进行运转不同,通过线粒体膜的蛋白质是在合成以后再运转的。这个过程有如下特征:1、通过线粒体膜的蛋白质在运转之前大多数以前体形式存在,它由成熟蛋白质和位于N端的一段前导肽(leaderpeptide)共同组成。迄今己有40多种线粒体蛋白质前导肽的一级结构被阐明,它们约含20〜80个氨基酸残基,当前体蛋白过膜时,前导肽被一种或两种多肽酶所水解,释放成熟蛋白质。2、蛋白质通过线粒体内膜的运转是一种需能过程。3、蛋白质通过线粒体膜运转时,首先由外膜上的Tom受体复合蛋白识别与Hsp70或MSF等分子伴侣相结合的待运转多肽,通过Tom和Tim组成的膜通道进入线粒体内腔。蛋白质跨膜运转时的能量来自线粒体Hsp70引发的ATP水解和膜电位差(图4-31)。
75成熟的线粒体蛋白线粒体基质图4-31线粒体Jt白质跨膜运转4・5・2・2前导肽的作用与性质拥有前导肽的线粒体蛋白质前体能够跨膜运转进人线粒体,在这一过程中前导肽被水解,前体转变为成熟蛋白,失去继续跨膜能力。因此,前导肽对线粒体蛋白质的识别和跨膜运转显然起着关键作用。前导肽一般具有如下特性:带正电荷的碱性氨基酸(特别是精氨酸)含量较为丰富,它们分散于不带电荷的氨基酸序列之间;缺少带负电荷的酸性氨基酸;羟基氨基酸(特别是丝氨酸)含量较高;有形成两亲(既有亲水又有疏水部分)a-螺旋结构的能力。带正电荷的碱性氨基酸在前导肽中有重要的作用,如果它们被不带电荷的氨基酸所取代,就不能发挥牵引蛋白质过膜的作用。前导肽跨膜运转时首先与线粒体外膜上的受体相结合,并非线粒体蛋白质前体都共用一种受体,但Tom受体是线粒体蛋白质跨膜运转时最主要的受体蛋白。线粒体有内、外两层膜,前导肽的不同部位可能在蛋白的跨膜运输过程中发挥不同的作用。有些前导肽含有.止运入"肽段,当该肤段被跨膜通道中的受体蛋白识别时,所运输的多肽将被定位在膜上。4•5•2•3叶绿体蛋白质的跨膜运转大多数科学家认为,叶绿体多肽是在胞质中的游离核糖体上合成后脱离核糖体并折叠成具有三级结构的蛋白质分子,多肽上某些特定位点结合于只有叶绿体膜上才有的特异受体位点。叶绿体定位信号肽一般有两个部分,第一部分决定该蛋白质能否进入叶绿体基质,第二部分决定该蛋白能否进入类囊体(图4-33)。在这一模型中,蛋白质运转是在翻译后进行的,在运转过程中没有蛋白质的合成。
76♦W碗质t*体如xCJ谣rtSE白水x■切除*娜分躇m信与驻二号》t.吃关■体腰3f切除6分g-Nt-OOC为■体3E白加体有实验把豌豆的RuBP竣化酶小亚基mRNA加入麦胚无细胞蛋白质合成系统中,合成了相对分子质量为2.0x10’的小亚基前体,离心处理含这种前体的麦胚提取物,除去核糖体,发现小亚基前体留在上清液中。如果把提纯的完整叶绿体加入这一上清液中,发现小亚基前体进入叶绿体基质内,降解为成熟小亚基(相对分子质量1,4x10'),并与大亚基结合形成全酶。由此证实,小亚基前体是从核糖体上释放后开始运转,并在运转过程中发生蛋白质降解的。叶绿体蛋白质运转过程有如下特点:(1)活性蛋白水解酶位于叶绿体基质内,这是鉴别翻译后运转的指标之一。从完整的叶绿体内提取的可溶性物质,能够把RuBP竣化酶小亚基前体降解或加工为成熟小亚基,离心后产生的叶绿体基质和破碎的叶绿体也具有这种功能,而类囊体和提纯的叶绿体膜都无此特性。在叶绿体蛋白质的翻译后运转机制中,活性蛋白酶是可溶性的,这一点也不同于分泌蛋白质的翻译-运转同步机制,因为后者活性蛋白酶位于运转膜上。因此,可根据蛋白水解酶的可溶性特征来区别这两种不同的运转机制。(2)叶绿体膜能够特异地与叶绿体蛋白的前体结合。从豌豆叶片中提取poly(A)mRNA,置于麦胚提取物的上清液中合成蛋白质,并与分离的叶绿体膜共温育,发现RuBP竣化酶小亚基前体和聚光叶绿素a、b结合蛋白质的前体郡能与叶绿体膜结合,而提取物中的其他蛋白质不与膜结合,说明叶绿体蛋白质前体与膜之间存在着特异性相互作用,或者说叶绿体膜上有识别叶绿体蛋白质的特异性受体。这种受体保证叶绿体蛋白质只能进入叶绿体内,而不是其他细胞器中。(3)叶绿体蛋白质前体内可降解序列因植物和蛋白质种类不同而表现出明显的差异。如衣藻叶绿体中RuBP小亚基的可降解序列含有44个氨基酸残基,在烟草叶绿体申相应的前导肽含有57个氨基酸残基。4.5.3核定位蛋白的运转机制在细胞质中合成的蛋白质一般通过核孔进人细胞核.所有核糖体蛋白都首先在细胞质中被合成,运转到细胞核内,在核仁中被装配成40s和60S核糖体亚基,然后运转回到细胞质中行使作为蛋白质合成机器的功能。RNA、DNA聚合酶、组蛋白、拓扑异构酶及大量转录、复制调控因子都必须从细胞质进入细胞核才能正常发挥功能。在绝大部分多细胞真核生物中,每当细胞发生分裂时,核膜被破坏,等到细胞分裂完成后,核膜被重新建成,分散在细胞内的核蛋白必须被重新运入核内,因此,为了核蛋白的重复定位,这些蛋白质中的信号肽被称为核定位序列(nuclearlocalizationsequence,NLS)一般都不被切除。NLS可以位于核蛋白的任何部位。蛋白质向核内运输过程需要一系列循环于核内和细胞质的蛋白因子,包括核运转因子
77(importin)a、0和一个相对分子质量较低的GTP酶(Ran)。a和B组成的异源二聚体是核定位蛋白的可溶性受体,与核定位序列相结合的是a亚基。由上述3个蛋白组成的复合物停靠在核孔处,依靠RanGTP酶水解GTP提供的能量进入细胞核,a和B亚基解离,核蛋白与a亚基解离,a和B分别通过核孔复合体回到细胞质中,起始新一轮蛋白质运转(图4-34).内・•日切割位点••体”,主**亮£自MetLgnL)«SetLnVaiLnAte>«VaiAlaVhlAl(Tkrl«iVdPreMeiLnS«PlwAl?AhOlu-.・传位,次要/充空白MetLy«U>LwltinwAltUePmLnVMVUProRx»rSerHiiSer'AlaGlu-WfiBKSS*Metl4nGinSerTbrlieAULwAteUoLmFreLaLaiPh«ThrProV>lThrLy>Al?ArgTht-充X葭1♦异结合SI曰MetL”AltAmAltLy«ThrlieH«AS的M«IMAlaUaAtaUeSerHitTteAUMetAlt*AqiAip-P-R**M«SerlieOlnH>>Ph«Ai(WAhUaKtFroHwFb»AhAtoPhaCylLnFroVilPbeAl?Hi*Pro-外■♦自・用量自M«Ly>AltThrLyiLeaVUUvOlyAhVUlieLeuOiySetnrLuleaAlaOly*Cy>Ser-LanBIBLnMLjnLMFrotnAkVWAlaVUAtoAlaOlyVilMetStrAtaGinAhMetAla*VMA>p-OmpAjISMelMetlitThrMetL)nlyiTkrAlalieAltUaAhVilAbU«AhOlyHaAlanrVUAbGh>Alt*AllPro-图4-35定位于不同变细胞结构的细菌蛋白质信号肽序列比较细菌同样能通过定位于蛋白质N端的信号肽(图4-35)将新合成的多肽运转到其内膜、外膜、双层膜之间或细胞外等不同部位。细菌中新翻译产生的蛋白质与胞质中的分子伴侣SecB相结合后就能被运送到细胞膜运转复合物SecA-SecYEG上,结合有新生肽的SecA在自身ATP酶活性作用下水解ATP并嵌入细胞膜之中,导致与SecA相结合的被运转蛋白N端约20个氨基酸通过膜运转复合物到达胞外。SecA再与另一个ATP相结合,变构嵌入膜内的同时再次把所运转蛋白的第二部分运出胞外,如此反复,直到把所运转蛋白全部送到胞外(图4-36).4,5*4蛋白质的降解越来越多的证据表明,生物体内蛋白质的降解过程是一个有序的过程。在大肠杆菌中,蛋白质的降解是通过一个依赖于ATP的蛋白酶(称为Lon)来实现的。当细胞中出现错误的蛋白质或半衰期很短的蛋白质时,该酶就被激活。Lon蛋白酶每切除一个肽键要消耗两个分子的ATP。蛋白质的半衰期大约从30s到许多天不等。虽然大部分真核蛋白的半衰期为数小时至数天,像血红蛋白这样少数蛋白的半衰期与细胞周期同样长(成红细胞=110天)。在真核生
78物中,蛋白质的降解依赖于泛素(ubiquitin),该蛋白只有76个氨基酸残基,序列高度保守(从酵母和人细胞中提取的泛素几乎完全相同!),生物细胞内即将被降解的蛋白首先在ATP的作用下与泛素相连(图4-37)。这个过程需有El、EZ、E3三个降解因子参与。一旦被降解蛋白与泛素相连接,这个复合体就能被运送到相对分子质量高达1x10,的蛋白降解体系中直到完全降解。研究发现,成熟蛋白N端的第一个氨基酸(除已被切除的N端甲硫氨酸之外,但包括翻译后修饰产物)在蛋白的降解中有着举足轻重的影响(表4-16).当某个蛋白质的N端是甲硫氨酸、甘氨酸、丙氨酸、丝氨酸、苏氨酸和缀氨酸时,表现稳定。其N端为赖氨酸、精氨酸时,表现最不稳定,平均2-3min就被降解了。N端残基半衰期稳定型残基甲硫氨酸、甘氨酸、丙氨酸、丝氨酸、苏氨酸、缴氨酸>20h不稳定型残基异亮氨酸、谷氨酰胺酪氨酸、谷氨酸脯氨酸-30min-10min-7min衰4-16=白质的半衰期与N1氯基・残基的关系续表半衰期-3minN端段基亮氨酸、革丙取酸、天冬酰胺、籁氨酸精氨酸BlTOTIg*HC-NH-Ly.的舞«2min■艮这个过程可导致被降M爱白。多个运瓢幅建懵图4-37泛宗住EI.E2和口的作用下,被静白相连接的过程思考题:1、tRNA在翻译过程中的作用如何2、原核生物和真核生物在蛋白质合成过程中主要异同点。第五章分子生物学研究方法教学内容:1、重组DNA技术发展史上的重大事件;2、DNA操作技术;3、基因克隆的主要载体系统:4、基因的分离与鉴定。
79教学目的:教学生分子生物学研究的基本方法。教学重点:工具酶;DNA操作技术;基因克隆的主要载体系统;基因的分离与鉴定。讲课具体内容分子生物学从20世纪中叶开始得到高速发展,其中最主要的原因之一是基因操作和基因工程技术的进步。基因操作:DNA的切割和连接、核酸分子杂交、凝胶电泳、细胞转化、核酸序列分析、基因的人工合成、定点突变和PCR扩增。这是分子生物学研究的核心技术。基因工程:在体外将核酸分子插入载体分子中,使之进入寄主细胞内并进行持续稳定的繁殖和表达。跨越天然物种屏障、把来自任何生物的基因置于毫无亲缘关系的新的寄主生物细胞之中的能力,是基因工程技术区别于其他技术的根本特征。本章将在回顾重组DNA技术史上主要事件的基础上,讨论DNA操作技术、基因克隆的常用载体系统以及基因的分离与鉴定等3个环节。5-1重组DNA技术发展史上的重大事件最近数十年来,分子生物学研究取得了前所未有的进步,概括地说,主要有3大成就:第一,在20世纪40年代确定了遗传信息的携带者、即基因的分子载体是DNA而不是蛋白质,解决了遗传的物质基础问题;第二,50年代提出了DNA分子的双螺旋结构模型和半保留复制机制,解决了基因的自我复制和世代交替问题;第三,50年代末至60年代,相继提出了"中心法则”和操纵子学说,成功地破译了遗传密码,阐明了遗传信息的流动与表达机制。但是,由于缺乏有效的分离和富集单一DNA分子的技术,科学家无法对这类物质进行直接的生化分析。事实上,DNA分子体外切割与连接技术及核甘酸序列分析技术的进步直接推动了重组DNA技术的产生和发展。重组DNA的核心是用限制性核酸内切酶和DNA连接幅对DNA分子进行体外切割和连接。这些工具酶的发现和应用是现代生物工程技术史上最重要的事件(表5-1)o限制性核酸内切酶能够识别DNA上的特定碱基序列并从这个位点切开DNA分子。1972年,Boyer实验室发现有一种核酸内切酶EcoRI能特异性识别GAAUC序列,将双链DNA分子在这个位点切开并产生具有粘性末端的小片段。他们还发现,能够把EcoRI酶切产生的任何不同来源的DNA片段通过粕性末端之间的碱基互补作用而彼此“粘合”起来。此后,大量类似于EroRl但具有独特识别序列的核酸内切酶被陆续发现(图5-1)„到目前为止,科学家已经几乎能随心所欲地把任何DNA分子切割成一系列不连续的片段,再利用凝胶电冰技术将这些片段按照分子量大小逐一分开,以供下一步研究。表5-2列出了核酸操作实验常用的几大类重要工具酶。
80—.HindHI(5r>AAGCTT(3,)IBamH1<57GGATCCO,)CCTAoaTTCCiAA♦♦♦4Not\(53GCGGCCOC<39C/a1(5*)ATCGAT(3)CGCCCiOCG♦TAGCTA♦♦/,><!(S")CTGCA0(31EtuRIAATTCGA<*«1'C♦CTTAAO♦♦f"vwII(S^cAGCTG«3)EcoRV(5,)0ATATC(3,)OTCGAC♦CTATAO♦♦Tth111I(S^GAfNNNGTCOOHat111(51GGCC(33ccaa♦CTCiNNNCAQ♦醉类功能限制性核酸内切酶识别并在特定位点切开DNADNA连接薛通过磷酸二酯键把两个或多个DNA片段连接成一个DNA分子DNA聚合BSI(大肠杆菌)按5,到3,方向加入新的核甘酸,补平DNA双链中的缺口反转录酶按照RNA分子中的毓基序列,根据减基互补原则合成DNA链把磷酸基团加到多聚核昔酸链的5'-0H末端(进行末端标记实验或用来进行DNA的连接)末端转移酶在双链核酸的3’末端加上多聚单核昔酸DNA外切酶m从DNA链的3,末端逐个切除单核甘酸入噬菌体DNA外切酶从DNA住的5,末端逐个切除单核甘酸碱性磷酸崩醵切除位于DNA链5,或3,末端的磷酸基团衰5-2・坦DNA实・中常见的主要工具,闺5-1几种主餐DNA内切I•所tR别的评列及其■切末地5•2DNA操作技术5-2-1核酸的凝胶电泳自从琼脂糖(agarose)和聚丙烯酰胺(Polyacrylamid)凝胶被引入核酸研究以来,按相对分子质量大小分离DNA的凝胶电泳技术,己经发展成为一种分析鉴定重组DNA分子及蛋白质与核酸相互作用的重要实验手段,也是现在通用的许多分子生物学研究方法,如DNA分型、DNA核甘酸序列分析、限制性内切酶片段分析以及限制酶切作图等的技术基础,受到科学界的高度重视。1♦基本原理一种分子被放置到电场中,它就会以一定的速度移向适当的电极。我们把这种电泳分子在电场作用下的迁移速度,叫做电泳的迁移率,它与电场强度和电泳分子本身所携带的净电荷数成正比。就是说,电场强度越大,电泳分子所携带的净电荷数量越多,其迁移的速度越快,反之则较慢。电泳的迁移率与分子的摩擦系数成反比。己知摩擦系数是分子大小、极性及介质粘度的函数,因此,根据分子大小的不同、构型或形状的差异以及所带的净电荷的多寡,便可以通过电泳将蛋白质或核酸分子混合物中的各种成分彼此分离开来。在生理条件下,核酸分子之糖-磷酸骨架中的磷酸基团,是呈离子化状态的,所以,DNA和RNA多核甘酸链又被称为多聚阴离子(Polyanions),把这些核酸分子放置在电场当中,它们就会向正电极的方向迁移。由于糖-磷酸骨架在结构上的重复性质,相同数量的双链DNA几乎具有等量的净电荷,因此它们能以同样的速度向正电极方向迁移。在一定的电场强度下,DNA分子的这种迁移速度,亦即电泳的迁移率,取决于核酸分子本身的大小和构型。这就是应用凝胶电泳技术分离DNA片段的基本原理。2•琼脂糖凝胶电泳琼脂糖是一种线性多糖聚合物。将琼脂糖粉末加热到熔点后冷却
81凝固便会形成良好的电泳介质。经过化学修饰的低熔点琼脂糖,在较低的温度下便会熔化,常用于DNA片段的制备电泳。«5-3琼版■及*西嫡麻峡凝胶分*DNA片段的帔力凝胶类瑁及浓度分离DNA片段的大小范Efi/bp0.3%琼脂幅500000000.7%琼脂糖200000001.4%琼脂慵6000-3004.0%聚丙烯酰胺1000-10010.0%聚丙烯酰胺500-2520.0%聚丙烯酰胺50-1琼脂糖凝胶分辨DNA片段的范围为0.2〜50kb之间;而要分辨较小分子量的DNA片段,则要用聚丙烯酰胺凝胶,其分辨范围为1〜lOOObp之间。凝胶浓度的高低影响凝胶介质孔隙的大小,浓度越高,孔隙越小,其分辨能力就越强。反之,浓度降低,孔隙就增大,其分辨能力也就随之减弱。例如,20%的聚丙烯酰胺凝胶可分离l-6bp的DNA小片段,而若要分离lOOObp的DNA片段,就要用3%的聚丙烯酰胺凝胶。再如,2%的琼脂糖凝胶可分离300bp的双链DNA分子,而分离大片段DNA就要用低浓度(0.3%~1.0%)的琼脂糖凝胶。在凝胶电泳中,加入适量嗅化乙锭(ethidiumbromide,简称EB)染料对核酸分子进行染色,然后将电泳标本放置在紫外光下观察,检测灵敏快捷,DNA带中仅含有0.05ng的微量DNA,也可以被清晰地检测出来。嗅化乙锭能插入到DNA或RNA分子的相邻碱基之间(图5-4),并在300nm波长的紫外光照射下发出荧光。把澳化乙锭直接加到DNA的凝胶介质中,此种染料便会在一切可能的部位与DNA分子结合,然而却不能与琼脂糖凝胶或聚丙烯酚胺凝胶相结合,因此,只有DNA分子能吸收EB并发出荧光。在适当的染色条件下,荧光强度与DNA片段的数量成正比。图3-4浜化乙钱(ElHr)染料的化学结构及其对DNA分子的插入作用(b)由于捕入丁慎化乙便分子,在紫外光照射F,琼脂f整皎电泳中DNA的条带便呈现出橘黄色荧光.易于差延5.2.2核酸的分子杂交将带有互补的特定核甘酸序列的单链DNA或RNA混合在一起,其相应的同源区段就会退火形成双链结构。如果退火的核酸来自不同的生物有机体,所形成的双链分子就被称为杂种核酸分子。能够杂交形成杂种分子的不同来源的DNA分子,其亲缘关系较为密切;反之,其亲缘关系则比较疏远。因此,DNA/DNA的杂交作用,可以用来检测特定生物有机体之间是否存在着亲缘关系,而形成DNA/RNA间杂种分子的能力可被用来揭示核酸片段中某一特定基因的位置。在大多数核酸杂交反应中,经过凝胶电泳分离的DNA或RNA分子,都必须通过毛细管或电导作用被转移到滤膜上,而且是按其在凝胶中的位置原封不动地"吸印"上去的,因此,核酸杂交也被称为"DNA印迹杂交”。由于该方法是E«M•Southern于1975年首先设计出来的,所以又叫做Southern
82blotting。杂交中常用的滤膜有尼龙滤膜、硝酸纤维素滤膜和二乙氨基乙基纤维素滤膜(DEAE)等。核酸分子杂交实验主要包括如下两个步骤:第1,将核酸样品转移到固体支持物滤膜上,这个过程特称为核酸印迹转移,主要的有电泳凝胶核酸印迹法、斑点和狭线印迹法、菌落和噬菌斑印迹法;第二是将具有核酸印迹的滤膜与带有放射性或其他标记的DNA或RNA探针进行杂交。杂交的具体步骤是将含有经电泳分离的不同相对分子质量DNA片段的琼脂糖凝胶,通过碱变性等预处理之后平铺在已用电泳缓冲液饱和了的滤纸上,在凝胶上部覆盖一张待用的滤膜,接着加一叠干滤纸,最后再压上一重物。这样,由于干滤纸的吸引力,凝胶中的单链DNA便随着电泳缓冲液一起转移。这些DNA分子一旦与滤膜接触,就会被吸附在上面,而且严格地保留了它们在凝胶中的谱带模式。在80℃下烘烤1〜2h或用紫外线交联法,就能将DNA片段永久性地固定在滤膜上(图5-6)。然后,将漉膜移放到加有放射性同位素标记的探针溶液中进行核酸杂交。这些探针是与被吸印DNA序列互补的RNA或单链DNA,一旦与滤膜上的单链DNA杂交之后,就很难再解链。因此,可以用漂洗法去掉游离的没有杂交上的探针分子,用X光底片曝光后得到放射自显影图片。在理想条件下,应用放射性同位素标记的特异性探针和放射臼显影技术,即便每带电泳条带仅含有2ng的DNA也能被清晰地检测出来。由于放射性同位素对人体的危害,近年来又发展了荧光法检测杂交信号的技术(图5-7),虽然灵敏度略低于同位素法,却使核酸杂交实验变得更为安全。X光*片图Southern班胶精修杂交技术5•2•3细菌转化所谓细菌转化,是指一种细菌菌株由于捕获了来自另一种细菌菌株的DNA而导致性状特征发生遗传改变的生命过程。提供转化DNA的菌株叫作供体菌株,接受转化DNA的细菌菌株则被称为受体菌株。大肠杆菌是分子生物学家常用的实验材料,也是基因工程重要的实验菌株。将快速生长中的大肠杆菌置于经低温(0℃)预处理的低渗氯化钙溶液中,便会造成细胞膨胀(形成原生质球),并与转化混合物中的外源DNA形成粘附在细胞表面的复合物。立即将该体系转移到42℃
83下做短暂的热刺激,复合物便会被细胞所吸收。利用噬菌体颗粒能够有效地将DNA注入到寄主细胞中这一特点,科学家又发明了重组体DNA分子的体外包装法(图5-8)o经包装的基因工程噬菌体颗粒能够借助细菌表面的噬菌体接受器位点将DNA注入受体细菌,并在这些细胞中得到繁殖和表达。图5-8入噬菌体可以作为克隆载体5-2-4核甘酸序列分析仪器分析发展很快。如果将来做测序工作,有了分子生物学基础,就可以做。如果将来工作中需要测序,一般送到公司去测。5•2•5基因扩增聚合酶链式反应,即PCR技术,是一种在体外快速扩增特定基因或DNA序列的方法。它可以在试管中建立反应,经数小时之后,就能将极微量的目的基因或某一特定的DNA片段扩增数十万乃至千百万倍。PCR技术的原理:首先将双链DNA分子在临近沸点的温度下加热分离成两条单链DNA分子,DNA聚合酶以单链DNA为模板并利用反应混合物中的四种脱氧核甘三磷酸合成新生的DNA互补链。因为DNA聚合酶需要有一小段双链DNA来启动("引导")新链的合成,所以,新合成的DNA链的起点,由加入到反应混合物中的一对寡核甘酸引物在模板DNA链两端的退火决定的。只要有合适的引物存在,两条单链DNA都可作为合成新生互补链的模板。由于在PCR反应中所选用的一对引物,是按照与扩增区段两端序列彼此互补的原则设计的,因此每一条新生链的合成都是从引物的退火结合位点开始并朝相反方向延伸的。这样,在每一条新合成的DNA链上都具有新的引物结合位点。整个PCR反应的全过程,即DNA解链(变性)、引物与模板DNA相结合(退火)、DNA合成(链的延伸)三步,可以被不断重复。经多次循环之后,反应混合物中所含有的双链DNA分子数,即两条引物结合位点之间的DNA区段的拷贝数,理论上的最高值应是2".一般的情况下,首先是将含有待扩增DNA样品的反应混合物放置在高温(约94C)环境下加热Imin,使双链DNA变性,形成单链模板DNA;然后降低反应温度(约56C)制冷Imin,使引物号两条单链模板DNA发生退火作用并结合在靶DNA区段两端的互补序列位置上;最后,将反应混合物的温度上升到72C左右保温1至数分钟,在DNA聚合酶的作用下,从引物的3'-端加入脱氧核甘三磷酸,并沿着
84模板按5'-3'方向延伸,合成新生DNA互补链。应用常规PCR技术能扩增两引物之间的DNA区段,然而,有时我们也希望扩增位于靶DNA区段之外的未知DNA序列,这就需要应用反向PCR仕e-vemePCR)技术。该技术的基本操作程序如图5-17所示。先用一种在靶DNA区段上没有识别位点的限制性内切核酸酶,从距靶DNA区段有一定距离的两侧位置切割DNA分子,然后将这些片段作分子内连接成环形。根据已知的靶DNA序列按向外延伸的要求设计一对向外引物,保证被扩增的是位于靶DNA区段两侧的未知DNA序列。095-17反向PCR的筝本1*作锲中5•3基因克隆的主要载体系统5•3•1质粒DNA及其分离纯化细菌质粒是存在于细胞质中的一类独立于染色体并能自主复制的遗传成分,虽然已发现有线性质粒,但已知的绝大多数的质粒都是由环形双链DNA组成的复制子。除了酵母的杀伤质粒是RNA质粒之外,迄今已知的其他质粒都是属于这种类型的DNA分子。质粒DNA分子可以持续稳定地处于染色体外的游离状态,也可能在一定的条件下被可逆性整合到寄主染色体上,随着染色体的复制而复制,并通过细胞分裂传递到后代。应用质粒作为基因克隆的载体分子,最看耍的前提是要获得大量纯化的质粒DNA分子。亳无疑问,寄主细胞的裂解作用是分离质粒DNA实验操作的关键步骤,通常加入溶菌酶或十二烷基硫酸钠(SDS)来促使大肠杆菌细胞裂解。如果寄主细胞没有完全裂解,就会显著降低质粒DNA的回收率。假如细胞裂解反应相当温和,同时实验操作又十分谨慎仔细,那么绝大部分的染色体DNA分子都将以高分子量的形式释放出来,可以用高速离心的方法使之与细胞碎片一起被沉淀除去,得到高纯度的质粒DNA。5•3•1•1氯化铅密度梯度离心法质粒DNA一般仅占细胞总DNA的1%〜2%左右,而且其化学结构与寄主染色体DNA之间并没有什么差别,所以,质粒DNA的纯化须从两者高级结构上的差异寻找依据。实验表明,在细胞裂解及DNA分离的过程中,大分子质量的细菌染色体DNA容易发生断裂形成相应的线性片段,而质粒DNA则由于其分子量较小、结构紧密,因此仍能保持完整的状态。这种差别对质粒DNA的纯化是十分有用的。氯化钠-EtBr密度梯度离心法,就是根据这一差别建立的纯化质粒DNA的经典技术。将含有溟化乙锭(EtBr)的氯化钠(CsCl)溶液加到大肠杆菌裂解液中,EtBr分子便会通过嵌入作用而结合到DNA链上,导致双螺旋结构发生解旋反应。线性的或开环的DNA分子,例如大肠杆菌染色体DNA片段,因其具有游离的末端而易于解旋,故可结合相当大量的EtBr分子。而像质粒这样的共价闭合环状的DNA分子,由于没有游离的末端,只能发生有限的解旋反应,结果便限制了EtBr分子的结合数量,因此染色体DNA片段要比质粒DNA结合更多的EtBr分子。在DNA-EtBr复合物中,结合的
85EtBr分子数量越多,其密度也就越低。因此,在EtBr达到饱和浓度的条件下,质粒DNA就要比线性的染色体DNA片段具有更高的密度。通过氯化钠密度梯度离心之后,它们就会被平衡在不同的位置,从而达到纯化质粒DNA的目的(图5-20).图5-20应用CsCl-EtBr密度梯度离心技术可直接在紫外光下观察到被分离的不同DNA分子染色体DNA带中,可能也含有一定数量的线性质粒DNA分子5«3•1•2碱变性法通过氯化葩-EtBr密度梯度离心法虽然可以得到高纯度、高质量的质粒DNA,但它操作复杂,需要价格昂贵的氯化钠和超速离心机设备,而且溟化乙锭又是一种较强的致癌物质,如果操作不慎,不仅会造成环境污染,还会危及实验工作人员的身心健康。因此,目前最流行的分离纯化质粒DNA的方法是碱变性法。这种方法是根据共价闭合环状质粒DNA与线性染色体DNA片段之间存在拓扑学上的差异发展而来的。实验观察发现,在pH值介于12.0-12.5的条件下加热DNA溶液,线性DNA会被变性,而闭合环状质粒DNA则不会被变性,尽管在这样的条件下连接DNA互补链之间的氢键也会断开,但由于闭合环状质粒DNA的双螺旋主链骨架的彼此盘绕作用,互补的两条链仍然会紧密地结合在一起。与此相反,线性DNA的两条链则会完全分开。若用制冷或恢复中性pH的方法处理DNA混合物,共价闭合环状的质粒DNA能迅速而准确地复性,但随机断裂产生的线性染色体DNA分子,彼此已经分离的互补链之间的复性作用就不会那么迅速而准确,往往聚集形成网状结构,与变性的蛋白质及RNA一道被离心沉淀下来。可以用酒精沉淀法收集仍然滞留在上清液中的质粒DNA„5-3-2重要的大肠杆菌质粒载体5•3•2•IpSClOl质粒载体PSC1O1是一种严紧型复制控制的低拷贝数的大肠杆菌质粒载体(图5-21),平均每个寄主细胞仅有1〜2个拷贝。其分子大小为9.09kb,编码有一个四环素抗性基因(tet)。该质粒具有EcoRI、HindllLBamHI、SalI,XhoI、PvuH以及SmaI等7种限制性核酸内切酶的单切割位点,在11汨由11、8201111和SalI等3个位点克隆外源DNA,都会导致tetr基因失活。PSC1O1质粒不仅具有可插入外源DNA的多个限制性核酸内切酶的单克隆位点,而且还具有四环素抗性的强选择记号,因此,它第一个被选为真核基因的克隆载体。当然,这个质粒载体也有其明显的缺点,它是一种严紧型复制控制的低拷贝质粒,从带有该质粒的寄主细胞中提取PSC101DNA,其产量就要比其他质粒载体低得多。EcoRl
86EH5-2I大豆杆窗pSQOI质粒质体示意国5•3•2•3pBR322质粒载体为改进转化子筛选技术,有必要用人工的方法构建一种既带有多种抗药性的强选择记号,又具有低分子质量、高拷贝以及外源DNA插入不影响复制功能的多种限制性核酸内切酶单切割位点等优点的新的质粒载体。目前,在基因克隆中广泛使用的PBR322质粒,就是按这种设想构建的一种大肠杆菌质粒载体。PBR322质粒是由3个不同来源的部分组成的:含有氨卡青霉素抗性基因(amp')、四环素抗性基因(tetr)和DNA复制起点(ori)(图5-22).PBR322质粒载体较小,其长度为4363bpo不仅易于纯化,而且即使携带上一段较大(6-8kb)的外源DNA片段,操作起来仍较为便利。PBR322质粒载体的第二个优点是具有两种抗生素抗性基因以用作转化子的选择记号,方便选择。例如,将外源DNA片段克隆在BamHI或SalI位点上,将这样的重组质粒转化到野生型大肠杆菌细胞中,并涂布在含有氨卡青霉素的选择性培养基平板上,那么存活下来的菌落都将具有Amp'的表型,它们也必定是获得了编码有这种抗性基因的转化子。PBR322质粒载体的第三个优点是具较高的拷贝数,若经过氯霉素扩增,每个细胞中可累积1000-3000个拷贝,为重组体DNA的制备提供了极大的方便。5,3,3X噬菌体载体噬菌体是一类细菌病毒的总称,英文名叫作bacteriophage,来源于希腊文“phagos",系指吞噬之意。如同质粒分子一样,噬菌体也可以用于克隆和扩增特定的DNA片段,是一种良好的基因克隆载体。作为细菌寄生物的噬菌体,它可以在脱离寄主细胞的状态下保持自己的生命,但一旦脱离了寄主细胞,就既不能生长也不能复制,因为大多数的噬菌体只能利用寄主核糖体、合成蛋白质的因子、各种氨基酸及能量代谢体系进行生长和增殖。噬菌体可被分为溶菌周期和溶源周期两种不同的类型。在溶菌周期,噬菌体将其感染的寄主细胞转变成为噬菌体的"制造厂",产生出大量的子代噬菌体颗粒。我们将只具有溶菌生长周期的噬菌体叫作烈性噬菌体。而溶源生长周期是指在感染过程中没有产生出子代噬菌
87体颗粒,噬菌体DNA被整合到寄主细胞染色体DNA上,成为它的一个组成部分。具有这种溶源周期的噬菌体,叫作温和噬菌体。很显然,以噬菌体DNA分子作载体,克隆含有目的基因的外源DNA片段,如果没有导致重要的噬菌体基因失活,那么当这种重组的噬菌体DNA分子感染了寄主细胞之后,插入的外源DNA片段便会随着噬菌体DNA分子一道增殖。用放射性同位素叩标记的特异性探针作噬菌斑放射自显影杂交,可以十分敏感地检测出含有这种重组体DNA分子的噬菌斑(即阳性斑点)。获得了阳性噬菌斑之后,我们就可按照类似于制备质粒DNA的方法,分离到大量的重组体噬菌体DNA,实现克隆基因的扩增。入噬菌体的分子为48.5kb,是一种中等大小的温和噬菌体。迄今已经定位的人噬菌体基因至少有61个,其中有一半左右参与了噬菌体生命周期的调控,我们称这类基因为人噬菌体的必需基因;另一部分基因则被称为非必需基因,因为当它们被外源基因取代之后,并不影响噬菌体的生命周期。由外源基因取代非必需基因所形成的重组噬菌体DNA,可以随寄主细胞一起被复制和增殖,而且在其溶源周期中,它们的DNA整合到大肠杆菌染色体DNA上,成为后者的一个组成部分。在X噬菌体线性双链DNA分子的两端,各有一条由12个核昔酸组成的彼此完全互补的5,单链突出序列,即通常所说的粘性末端。注入到感染寄主细胞内的人噬菌体的线性DNA分子,会迅速地通过粘性末端之间的互补作用,形成环形双链DNA分子。随后在DNA连接酶的作用下,将相邻的5'-P和3'-0H基团封闭起来,并进一步超盘绕。这种粘性末端结合形成的双链区段称为cos位点cohesive-endsite,粘性末端位点,图5-23)。精甘薛基因lacZ的编码序列,那么由这种重组体感染的心一指示前,由于不能合成B-半乳精甘静,只能形成无色的噬落斑。/粘性末.、5'-PGOGCGOCGACCTCCCGCCGCTGGA-5--PV环化作用图5-23人嘴菌体线性DNA分子的粘性末端及其环化作用(•)具有互扑单域末端(粘性末*)的XDNA分子"b)通过帖性末端之间的*基配对作用实现的线性分子的环化作用,由此形成的双链区叫作co.位点对大多数目前在基因克隆中常用的限制性核酸内切酶来说,野生型的人噬菌体DNA具有太多的切割位点,它有5个Ec。RI酶切位点和7个HindIII院切位点。显然,它不适于用作基因克隆的载体,必须想办法从野生型X噬菌体基因组DNA上消去一些多余的醐切位点并切除非必要区段,才能将它改造成适用于基因克隆的载体。1•插入型载体外源的DNA克隆到插入型X载体分子上,就会使噬菌体的某种生物功能丧失效力,即所谓的插入失活效应。根据插入失活效应的特异性,插入型载体又可以进一步被分为免疫功能失活和大肠杆菌P-半乳糖甘酶失活两种亚型。(1)免疫功能失活插入型载体这类载体的基因组中有一段免疫区,其中带有一两种限制性核酸内切酶的单切割位点。当外源DNA片段插入到这种位点上时,就会破坏载体所具有
88的合成功能性阻遏物的能力,阻碍其进入溶源周期。因此,凡带有外源DNA插人的人重组体都只能形成清晰的噬菌斑,而没有外源DNA插入的亲本噬菌体就会形成混浊的噬菌斑。这种形态学上的差异,为分离重组体分子提供了方便的标志。12)B-半乳糖甘酶失活插入型载体许多种载体的基因组中含有大肠杆菌的lacZ区段,编码B-半乳糖普酶基因lacZ。由这种载体感染大肠杆菌的lac指示菌,涂布在补加有IPTG和X-gal的培养基平板上,会形成蓝色的噬菌斑,但在克隆过程中,如果外源DNA插入到lac5区段上,阻断了B-半乳糖甘酶基因lacZ的编码序列,那么由这种重组体感染的lac指示菌,由于不能合成B-半乳糖甘酶,只能形成无色的噬菌斑。2•替换型载体又叫作取代型载体(substitutionvector),是一类在人噬菌体基础上改建的,在其中央部分有一个可以被外源插入DNA分子所取代的DNA片段的克隆载体。在构建此类载体时,安排在中央可取代片段两侧的多克隆位点是反向重复序列,因此当外源DNA插人时,一对克隆位点之间的DNA片段便会被置换掉,从而有效地提高了克隆外源DNA片段的能力。在ANM781替换型载体中,可取代的EcoRI片段,编码有一个supE基因,这种入NM781噬菌体感染细胞后,其lacZ基因的突变琥珀被抑制,因此能在X-gal琼脂培养基上产生出蓝色的噬菌斑。但是,如果这个具有supE基因的EcoRI片段被外源DNA取代了,那么所形成的甫组体噬菌体,在上述指示培养基上只能产生出无色的噬菌斑。5-3-4柯斯质粒载体"Cosmid”一词是由英文"cossite-earringplasmid”缩写而成的,其原意是指带有粘性末端位点的质粒。因此我们说,所谓柯斯质粒其实是一类由人工构建的含有ADNA的cos序列和质粒复制子的特殊类型的质粒载体。在柯斯质粒载体PHC79中,除cos位点之外,其两侧还具有与噬菌体包装有关的入DNA短序列。质粒DNA部分则是一个完整的复制子,包括一个复制起点和两个抗菌素抗性基因amp',和tet'。很明显,pHC79柯斯质粒兼具了人噬菌体载体和PBR322质粒载体两方面的优点,其克隆能力为31〜45kb,而且能够被包装成为具有感染能力的噬菌体颗粒。柯斯质粒载体的特点:第一,具有人噬菌体的特性。柯斯质粒载体在克隆了合适长的外源DNA,并在体外被包装成噬菌体颗粒之后,可以高效转染对人噬菌体敏感的大肠杆菌寄主细胞。进入寄主细胞之后的柯斯质粒DNA分子,能按照X噬菌体DNA同样的方式环化。第二,具有质粒载体的特性。柯斯质粒载体具有质粒复制子,因此能像质粒DNA一样在寄主细胞内进行复制,并且能在氯霉素作用下,获得进一步扩增。此外,柯斯质粒载体通常也都具有抗菌素抗性基因,可供作重组体分子表型选择标记,其中有一些还带上基因插入失活的克隆位点。第三,具有高容量的克隆能力。柯斯质粒载体的分子仅具有一个复制起点,一两个选择记号和cos位点等三个组成部分,其分子较小,一般只有5〜7kb左右。因此,可以插入到柯斯质粒载体上并能被包装成A噬菌体颗粒的最大外源DNA片段,即柯斯质粒载体的克隆极限可达45kb左右。5,3,5pBIuescript噬菌粒载体pBlueschpt是专用的商品名称,系指由Sbatagene公司发展的•类从pUC载体派生而来的噬菌粒载体,简称为pBS(+/-),如今则更多地叫作pBlue-schptKS(+/-)或pBlu筏chptSK(+/-).其基本结构特征如图5-24所不:'(1)在多克隆位点区(MCS)的两侧,存在一对m和W噬菌体的启动子,用以定向指导插人在多克隆位点上的外源基因的转录活动;(2)同时具有一个单链噬菌体M13或n的复制起点和一个来自ColEI质粒的复制起点,保证pBlueschpt噬菌粒载体在有或无辅助噬菌体共感染的不同情况下,按照不同的复制形式分别合成出单链或双链DNA;(3)编码有一个氨卡青霉素抗性基因,作为转化子克隆的选择标记;
89(4)含有一个她cZ基因,可以按照X-gal-I叮G组织化学显色法筛选噬菌粒载体的重组子。图5-24PBlu<»criptSK(♦/-)噬常粒或体的分子结构示意图SK表示多克*位点区的一种取向,即&Z*因是按照SkI-5I的方向转录“+/-)表示单植噬菌体<1复制起点的两种相反的取向。(1(+)起点表示当pBluecriptl®菌粒载体和辅助**体共感染寄生细胞时,能缘回收到㈤'Z基因的有意义链DNA;而fl(-)起点则表示当pBlunnpt电菌粒*体与辅助*菌体共感!&哥主的18时.可回收到&Z基因的无意义镰DNA5-4基因的分离与鉴定在当今生命科学的各个研究领域中,"克隆"(clone)一词己被广泛使用。通常大家会说克隆就是无性繁殖。在不同层面上有其具体含义,在多细胞的高等生物个体水平上,克隆表示由具有相同基因型的同一物种的两个或数个个体组成的群体,从同一受精卵分裂而来的单卵双生子(monozygotictwins)便是属于同一克隆。在细胞水平上,克隆一词是指由同一个祖细胞(Progenitorcell)分裂而来的一群遗传上同一的子细胞群体。在分子生物学上,人们把将外源DNA插入具有复制能力的载体DNA中,使之得以永久保存和复制这种过程称为克隆。我们通常所说的基因克隆,包含待研究的目的基因的分离和鉴定两个主要内容,整个过程包括如下4个基本步骤:(1)用于基因克隆的DNA材料的选择以及DNA分子的片段化;(2)外源DNA片段与载体分子的体外连接反应;(3)将人工重组的DNA分子导人它们能够进行正常复制的寄主细胞;(4):重组体分子的转化子克隆的选择或筛选。5«4«1DNA片段的产生与分离基因克隆的第一步是要从实验材料中制备包括"目的基因”在内的DNA片段群体,而且这个DNA片段群体必须包容整个基因组的全部序列,DNA片段的大小要适合于基因操作的要求。最简单的办法是利用限制性核酸内切酶消化供体基因组DNA,并直接将消化产物与载体分子相连接。这个被称为鸟枪法(shot-gunapproach)的方法最明显的缺点,就是所形成的茶组
90体分子带有大小不同的插入片段。由于高等真核生物的基因组庞大,按一般载体承受外源DNA插入能力(大约为1000〜3000bp)计算,能产生几十万个大小不同的DNA片段,形成由几十万个大小不同的重组体分子组成的克隆群体。要想从如此巨大的群体中,选出带有目的基因的克隆,显然是十分费事的。为了克服上述困难,有人建议采用局部双酶消化法,保证DNA产物大小在10〜30kb左右,通过蔗糖梯度离心或制备凝胶电泳技术,得到约为20kb的随机群体并将其克隆到合适的载体匕5•4•2重组体DNA分子的构建1•外源DNA片段定向插入载体分子若用两种不同的限制性核酸内切酶同时消化一种特定的DNA分子,将产生具有两种不同粘性末端的DNA片段。因此,如果载体分子和待克隆的DNA分子都是用同一对限制性核酸内切酶切割,那么,载体分子和外源DNA片段将按一种取向退火形成重组DNA分子,从而保证外源DNA片段定向插入载体分子。事实上,载体分子和外源DNA插入片段(或称供体DNA),并不一定总能产生出互补的粘性末端,所以,有时采用平末端连接法或采用附加衔接物的办法来提高平末端之间的连接效率(图5-25)oBamHI推失分子外・DNA片段ffl5-25应用HI接头梅嘘・蛆体分子的基本程序由于1•头分子具才不会发生自身作用.加到外鼻DNA片段上的梭央分子过多愤甘*的催化作用被■斯・♦化.然后问经■切的■体分子迷接.形成分子2•最佳连接反应为了使连接反应物中的外源DNA片段都能插入载体分子形成重组DNA,必须设法阻止经限制性内切酶切割后的线性载体分子的自身再环化作用,以提高DNA片段的插入效率。目前常用碱性磷酸酯酶处理由内切幅消化产生的线性载体分子,除去该DNA的5'-P末端,而留下一个5'-0H基团。经碱性磷酸酯酶处理过的线性载体分子,除非插入了外源DNA片段,否则就不再能够重新环化成有功能的载体分子。在连接反应中,正确地调整载体DNA和外源DNA之间的比例,是能否获得高产量重组转化子的一个甫耍因素。应用X噬菌体或柯斯质粒作载体时,配制高比值的载体DNA/供体DNA的连接反应体系有利于重组分子的形成。以柯斯质粒载体为例,因为只有当供体DNA片段的两个末端都同柯斯质粒载体结合之后,才能被有效地包装。若使用质粒分子作为克隆的载体,其重组体分子由一个载体分子和一个供体DNA片段连接环化而成,所以,当载体DNA与供体DNA的比值为1时,有利于这类重组体分子的形成。3•重组体分子导入受体细胞的途径将外源重组体分子导人受体细胞的主要途径包括转化(或转染)、转导、显微注射和电穿孔等。转化和转导主要适用于细菌一类原核细胞和酵母等低等真核细胞,而显微注射和电穿孔则主要应用于高等动物的真核细胞。5•4•3cDNA基因克隆
91真核生物基因组DNA十分庞大,而且含有大量的重复序列。因此无论是采用电泳分离技术还是通过杂交的方法,都难以宜接分离到目的基因片段。这个问题可以通过由mRNA产生的cDNA进行克隆而得以部分解决,因为尽管高等生物•般具有3〜5万种左右不同的基因,但在一定时间阶段的单个细胞或组织中,仅有15%左右的基因得以表达,产生出约5000-10000种不同的mRNA分子。cDNA克隆的基本过程是通过一系列酶催作用,使总poly(A)mRNA转变成双链cDNA群体并插入到适当的载体分子上,转化大肠杆菌寄主菌株细胞,构成包含所有基因编码序列的cDNA基因文库。1清质量mRNA的制备可应用PromegaPolyATtractmRNA分离系统分离poly(A)mRNA。将用生物素标识的寡聚(dT)引物与细胞总RNA共温育,加入与微磁球相连的抗生物素蛋白,用磁场吸附通过寡聚(dT)弓I物与抗生物素蛋白及强力微磁球相连的mRNA(图5-26)。WWmRNA.gARZAffl5-26PtolyAT»rwctmRNA的分化过程画图2•反转录生成cDNA可同时在反转录系统中加入寡聚(dT)及随机引物R6,以保证得到全长cDNA(图5-27),应选用活性较高的反转录酶及甲基化dCTP,保证所获得双链cDNA的方向性(图5-28)。因为绝大多数大肠杆菌细胞都会切除带有5'-甲基C的外源DNA,所以实验中常选用mcrAmcrB菌株。
92开票NS机6M不明恤(RQ・观(di〉,3.RS机6X基引物ttiRTMA,▲、mRNA〃、mRNA,▲、,,■・・"■'SJr-1119Jeg…回回回国回回Ex・第一融合成(A).(A).(A).OlT叼,7乙1|R,I——jR6|~~|RJ1尸61第二・合成Ml上在coRI«NorI)接头・IK化cDNA分策cDNAft成完毕.准餐连接图5-27oDNA合成过程示意图选用cDNA克隆这一实验方案时必须考虑到目的基因mRNA在特定的生物体组织中的含量问题。在组织和培养的细胞中,各种mRNA的含量是极不相同的,有些mRNA含量十分丰富,每个细胞可拥有数千个拷贝,而有些mRNA的含量很低,每个细胞只有几个拷贝。根据mRNA分子含量的多寡,即我们所说的丰富程度(简称丰度),可以将mRNA划分为高丰度、中丰度和低丰度3种不同的类型(表5-4)。从表中看出低丰度mRNA,每个细胞仅有14个拷贝左右,其总量约占总mRNA的30%,其中约有11000个左右的不同种类的mRNA。因此,为了获得一个能够代表全部低丰度mRNA序列的cDNA基因文库,必须的最低克隆数(理论值)应是11000/0-30^37000,但由于在实验中存在着取样上的差异,有些序列容易被克隆,有些序列却不容易被克隆,为了保证基因文库中能够包含所有的序列,就必须增加克隆的数目。为了使上述低丰度mRNA的cDNA克隆达到99%的期望率,大约需要筛选170000个克隆。在质粒分子上有一个抗药性基因(标记基因),在培养基中加入相应的抗生素,带质粒的细菌可生长,不带的则不能生长。经过特殊处理的具有吸收外源DNA能力的细菌细胞是感受态细胞。当重组质粒分子与感受态细胞混合,感受态细胞数量远大于重组质粒分子时,这样在培养基上长出的单菌落是由一个重组质粒分子导入一个细菌细胞后经过繁殖而形成的。«5-4真核细胞mRNA群体的丰度等级及其复杂性分析丰度等级相应丰度等级的mRNA群体占总mRNA的百分数/%在相应丰度等级中所含的不同种类mRNA序列的数量/个每个细胞所含的相应丰度mRNA序列的拷贝数/个高丰度22303500中丰度491090230低丰度2910670145•4•4克隆基因的分离1•应用核酸探针分离克隆目的基因把基因文库转移到尼龙膜或硝酸纤维素滤膜上,就可以与特异性的核酸探针进行菌落或噬菌斑杂交,以便筛选出具有目的基因的阳性克隆,
93这个过程叫作克隆基因的分离或筛选。应用核酸探针分离FI的基因的方法叫作核酸杂交筛选法。此法的最大优点是应用广泛,而且相当有效,适用于大规模筛选。只要有现成可用的核酸探针,我们就有可能从任何生物体的任何组织中分离目的基因,也就能够有效地检测任何一种插入的外源DNA序列,而不以这种序列能否在大肠杆菌细胞中表达为前提。1•觥mRNA差别显示技术分离克隆目的基因根据表达特性的差异可将高等真核生物的基因分为两大类:一类叫做看家基因(house-keepinggene),以其组成型表达模式维持细胞的基本代谢活动;另一类叫做发育调控基因(developmentalregulatedgene),以其时空特异性表达模式完成个体的正常生长、发育与分化,我们将不同基因在生物个体发育的不同阶段,或是在不同的组织或细胞中发生的按时间、空间进行有序表达的方式称为基因的差别表达(differentialexpression)»生物的发育与分化、细胞的周期变化、生物体对外界环境压力的反应以及个体的衰老与死亡等所有的生命过程,都可归结于基因的差别表达。1992年,美国波士顿Dena-Farber癌症研究所的两位科学家P.Liang和A.D.Pardee发明了--种叫做mRNA差别显示PCRGnRNAdifferentialdisplay)技术,简称DDRT-PCR,可以从一对不同基因型的细胞群体所产生的约15000种mRNA中有效地鉴定并分离出差别表达的基因。从mRNA分子3'端序列结构的分析可以看出,在这段poly(A)序列起点碱基之前(亦即5’上游)的两个碱基,只能有12种可能的排列组合。5,-AGAAAAA…AA-3,5'-CGAAAAA…AA-3'5'-GGAAAAA…AA-3'5'-TGAAAAA“AA-3'5'-ATAAAAA…AA-3'5'-CTAAAAA…AA-3'5,-GTAAAAA-AA-3,S^TTAAAAA-AA-315'-ACAAAAA…AA-3'5l-CCAAAAA-AA-3,5'-GCAAAAA-AA-3,5,-TCAAAAA-AA-3,根据这种序列结构特征,P・liang等人设计合成了总共12种不同的下游引物,用以反转录mRNA,合成第一链cDNA。这种引物通常叫作3'端锚定引物,它是由11个或12个连续的脱氧胸苜酸加上两个3'端锚定脱氧核甘酸组成,并用5'-T,,MN或5'-T“MN通式表示。其中M为除了T以外的任何一种核甘酸(即A、G或C),而N则为任何一种核甘酸(即A、G、C或T),故MN共有12种不同的排列组合方式。每一种人工合成的寡核苛酸引物,都能够把总mRNA群体的1/12分子反转录成mRNA-cDNA杂合分子。由于在这些cDNA群体中,代表某一特定细胞类型或发育阶段的mRNA种类的含量是相当低的,所以要把一种只在某一发育阶段或某种细胞类型中表达、而在另一发育阶段或某种细胞类型中不表达的目的基因分离出来,就需要通过PCR扩增。在DDRT-PCR反应中,常用3'端锚定引物和8,10-mer的5'-端随机引物组成的引物对,以第一链cDNA为模板进行PCR扩增(图5-29)。DDRT-PCR的主要操作步骤如下:(1)从不同发育阶段或不同基因型的细胞群体中分离mRNAj以3'锚定引物作为反转录的引物,合成第一链cDNA;(2)用5'随机引物和某个3'端锚定引物对扩增第一链(掺入Mp-dNTP);(3)用DNA变性测序胶分离扩增产物,X光片曝光后检测差别条带;(4)回收特异性差别条带;(5)用同一引物对扩增己回收的DNA条带;(6)用Northern-blotting,Southern-blotting及测序法分析所得的条带;(7)以该DNA片段做探针,筛选全长cDNA或核基因。思考题:PCR原理与技术。cDNA文库的构建。
94Northern-blotting的基本技术和原理。第六章基因的表达与调控(上)一一原核基因表达调控模式教学内容:1原核基因表达调控总论;2乳糖操纵子与负控诱导系统;3色氨酸操纵子与负控阻遏系统:4转录后调控。教学目的:让学生了解原核基因表达调控模式、掌握乳糖操纵子与负控诱导系统和色氨酸操纵子与负控阻遏系统模式。教学重点:乳糖操纵子与负控诱导系统和色氨酸操纵子与负控阻遏系统模式。讲课具体内容原核生物和单细胞真核生物直接暴露在变幻莫测的环境中,食物供应无保障,只有根据环境条件的改变合成各种不同的蛋白质,使代谢过程适应环境的变化,才能维持自身的生存和繁衍。高等真核生物代谢途径和食物来源都比较稳定,但由于它们是多细胞有机体,在个体发育过程中出现细胞分化,形成各种组织和器官,而不同类型的细胞所合成的蛋白质在质和量上都是不同的。因此,不论是真核还是原核细胞都有一套准确地调节基因表达和蛋白质合成的机制。自然选择倾向于保留高效率的生命过程。在单细胞生物中,使细胞代谢总效率增加的突变细胞生长略快于野生型,只要有足够的时间,突变细胞系将占整个细胞群体的主导地位。例如,在一个每30min增殖一倍的10"细菌群体中,若有一个细菌变成了29•5min增殖一倍,大约经过80天的连续生长后,这个群体中的99•9%都将具有29・5111打增殖一倍的生长速度(假设培养液被不断地稀释,否则细菌将在一两天内停止生长)。原核生物细胞的基因和蛋白质种类较少,如大肠杆菌基因组约为4《OxlO'bp共有4288个可读框。据估计,一个细胞中总共含有IO,个蛋白质分子,如果每个基因等同翻译的话,任何一个多肽应有2500个拷贝。但是,这些蛋白质并不是以相同拷贝数存在于每个细胞中的,有些蛋白质的数目相当固定,另一些则变化很大;例如,每个大肠杆菌细胞可以有约15000个核糖体,与其结合的约50种核糖体蛋白数量也是十分稳定的。糖酵解体系的酶含量很大,其数目也极恒定。此外如DNA聚合酶、RNA聚合酶等都是代谢过程中十分必需的酶或蛋白质,其合成速率不受环境变化或代谢状态的影响,这一类蛋白质被称为组成型(constitutive)合成蛋白质。另一种类型则被称为适应型或调节型(adaptiveorregulated),因为这类蛋白质的合成速率明显地受环境的影响而改变。例如,一般情况下,一个大肠杆菌细胞中只有15个分子的B-半乳糖甘前,但若将细胞培养在只含乳糖的培养基中,每细胞中这个酶的量可高达几万个分子。其他参与糖代谢的酶,氨基酸、核甘酸合成系统的酶类,其合成速度和总量都随培养条件的变化而改变。细菌中所利用的大多数基本调控机制一般执行如下规律:一个体系在需要时被打开,不需
95要时被关闭。这种"开-关”(on-off)活性是通过调节转录来建立的,也就是说mRNA的合成是可以被调节的。实际上,当我们说一个系统处于“off”状态时,也可能有本底水平的基因表达,常常是每世代每个细胞只合成1或2个mRNA分子和极少量的蛋白质分子。为了方便,我们常常使用“off”这一术语,但必须明白所谓"关”实际的意思是基因表达量特别低,很难甚至无法检测。6.1原核基因表达调控总论我们知道,所有生物的遗传信息,都是以基因的形式储藏在细胞内的DNA(或RNA)分子中。随着个体的发育,DNA分子能有序地将其所承载的遗传信息,通过密码子-反密码子系统,转变成蛋白质分子,执行各种生理生化功能,完成生命的全过程。科学家把这个从DNA到蛋白质的过程称为基因表达(geneexpression)(图6-1),对这个过程的调节就称为基因表达调控(generegulation或genecontrol)(>基因调控是现阶段分子生物学研究的中心课题。要了解动、植物生长发育的规律、形态结构特征和生物学功能,就必须弄清楚基因表达调控的时间和空间概念。基因表达调控主要表现在以下二方面:(1)转录水平上的调控(transcriptionalregulation);(2)转录后水平上的调控(post-transcriptionalregulation),包括①mRNA加工成熟水平上的调控(differentialprocessingofRNAtranscript);②翻译水平上的调控(differentialtranslationofmRNA)□基因调控的指挥系统也是多样的,不同的生物使用不同的信号来指挥基因调控。原核生物中,营养状况(nutritionalstatus)和环境因素(environmentalfactor)对基因表达起着举足轻重的影响。在真核生物尤其是高等真核生物中,激素水平(hormonelevel)和发育阶段(developmentalstage)是基因表达调控的最主要手段,营养和环境因素的影响力大为下降。在转录水平上对基因表达的调控决定于DNA的结构、RNA聚合甑的功能、蛋白因子及其他小分子配基的相互作用。在研究转录及转录调控以前,我们先来分析一下原核与真核生物转录与翻译的特点。因为细菌mRNA在形成过程中与核糖体混合在一起,所以,细菌的转录翻译过程几乎发生在同一时间间隔内,转录与翻讲相偶联(coupledtranscriptionandtranslation)„真核生物中,转录产物(Primarytranscript)只有从核内运转到核外,才能被核糖体翻译成蛋白质(图6-2。)图6-2真楼与原核生物转泰及■译词拄的总体特征比较6.1.1原核基因调控机制的类型与特点原核生物的基因调控主要发生在转录水平匕根据调控机制的不同可分为负转录调控(negativetranscriptionregulation)和正转录调控(Positivetranscription
96regulation)0在负转录调控系统中,调节基因的产物是阻遏蛋白(repressor),起着阻止结构基因转录的作用。根据其作用特征又可分为负控诱导和负控阻遏二大类。在负控诱导系统中,阻遏蛋白不与效应物(诱导物)结合时,结构基因不转录;在负控阻遏系统中,阻遏蛋白与效应物结合时,结构基因不转录。阻遏蛋白作用的部位是操纵区。在正转录调控系统中,调节基因的产物是激活蛋白(activator)。也可根据激活蛋白的作用性质分为止控诱导系统和正控阻遏系统。在正控诱导系统中,效应物分子(诱导物)的存在使激活蛋白处于活性状态;在正控阻遇系统中,效应物分子的存在使激活蛋白处于非活性状态(图6-3,表6-1)。讲・因子萎国*达>>m“@**)<<«)共阻■盘白图6-3细窗中的转录词控体系(•)负控说号系统;(b)正控说导系统;(c)负控电遢系统;(d)正控阻遢系统参与大肠杆菌中基因表达调控最常见的蛋白质可能是。因子,基因组序列分析后发现存在6种。因子,并根据其相对分子质量的大小或编码基因进行命名(表6-2),其中。7°是调控最基本的生理功能如碳代谢、生物合成等基因的转录所必须的。
97*6-2大肠杆■中的各种。因子比较主要功能参与对数生长期和大多数碳代谢过程基因的调控参与多数氮源利用基因的调控分裂间期特异基因的表达调控熊休克基因的表达调控鞭毛趋化相关基因的表达调控N战与核心・结合参与DNAX俅。因子才能结合DNA1与启动子区相苴伊用保证只有与核心・结合,Tn图6-4大肠杆曲中的<y因子(以</°为例》主襄包括4个结构域过度热休克基因的表达网控.-35区-10区1RNA起始位率上讷调控元件[[TTOACelNj7[TATAAT]N…|]mRNA—24区—12区jRNA起始位中上渐调控元件I|CTOGNA[NiITTOCAIMt|.]mRNA\f\J\T^图6-5</°(上)和b54(下)因子火别并结合在所*控基因上游的不冏区域除参与氮代谢的产以外,其它5种。因子在结构上具有同源性,所以统称。7°家族。研究发现,所有。因子都含有4个保守区(图6-4),其中第2个和第4个保守区参与结合启动区DNA,第2个保守区的另一部分还参与双链DNA解开成单链的过程。与上述。因子特异性结合DNA上的-35区和TO区不同,。s’因子识别并与DNA上的-24和T2区相结合(图6-5)»在与启动子结合的顺序上,。7°类启动子在核心酶结合到DNA链上之后才能与启动子区相结合,而。则类似于真核生物的TATA区结合蛋白(TBP),可以在无核心酶时独立结合到启动子上。通过特殊代谢物调节的基因活性主要有可诱导和可阻遏两大类:(1)可诱导调节是指一些基因在特殊的代谢物或化合物的作用下,由原来关闭的状态转变为工作状态,即在某些物质的诱导下使基因活化。这类基因中最突出的例子是大肠杆菌的乳糖操纵子。大肠杆菌在含有葡萄糖的培养基中生长良好,在只含乳糖的培养基中开始时生长不好,直到合成了利用乳糖的一系列酶,具备了利用乳糖作为碳源的能力才开始生长。细菌获得这一能力的原因就是因为在诱导物乳糖的诱导下开动了乳糖操纵子,表达它所编码的3个酶:B-半乳糖背酶(使乳糖水解为半乳糖和葡萄糖);B-半乳糖背透过酶(使乳糖进入细菌细胞内);B-半乳糖昔乙酰基转移酶(使半乳糖第六位碳原子乙酰化)。这个操纵子开动的效果是十分明显的。以B-半乳糖甘酸为例,在葡萄糖培养基中生长时,每个细胞只有几个酶分子,但若转移到乳糖培养基中,几分钟后,每个细菌细胞内可产生3000个酶分子。因此,这类基因被称为可诱导基因,这类醐被称为诱导酶,这个生化过程被称为酶的诱导合成。(2)可阻遏调节这类基因平时都是开启的,处在产生蛋白质或酶的工作过程中,由于一些特殊代谢物或化合物的积累而将其关闭,阻遏了基因的表达。比如大肠杆菌生活中必须有色氨酸,一般情况下,该操纵子是开启的。如果在细菌培养基中加入色氨酸,使之能利用培养基中的色氨酸来维持生活而不需要再费力去合成,细菌往往能在2-3min内完全关闭
98该操纵子。这就是说,某一代谢途径最终产物合成醯的基因可以被这个产物本身所关闭。这种基因被称为可阻遏基因,这些酶被称为可阻遏醐,这个现象被称为可阻遏现象,这些起阻遏作用的小分子被称为阻遏物。在这里,色氨酸或与其代谢有关的某种物质在阻遏过程(而不是诱导过程)中起作用。作为一般规律,可诱导的操纵子总是一些编码糖和氨基酸分解代谢的蛋白的基因,这些糖和氨基酸平时含量很少,细菌总是利用更一般的能源物质一一葡萄糖的水解来提供能源,因此,这些操纵子常常是关闭的。一旦生存条件发生变化,如葡萄糖缺乏而必须利用乳糖作为能源时,就要打开这些基因。可阻遏基因的情况恰好相反,它们是一些合成各种细胞代谢过程中所必须的小分子物质(如氨基酸、喋吟和喀咤等)的基因,由于这类物质在生命过程中的重要地位,这些基因总是打开着的。只有当细菌生活环境中有充分供应时,才关闭这些基因,停止其合成。6•1•2弱化子对基因活性的影响属于这种调节方式的有大肠杆菌中的色氨酸操纵子、苯丙氨酸操纵子、苏氨酸操纵子、异亮氨酸操纵子和缀氨酸操纵子以及沙门氏菌的组氨酸操纵子和亮氨酸操纵子、嗨咤合成操纵子等等。在这种调节方式中,起信号作用的是有特殊负载的氨酰TRNA的浓度,在色氨酸操纵子中就是色氨酰-tRNA的浓度。当操纵子被阻遏,RNA合成被终止时,起终止转录信号作用的那一段核甘酸被称为弱化子。这种因为核糖体在基因转录产物上的不同位置,决定了RNA可以形成哪一种形式的二级结构、并由此决定基因能否继续转录的调节方式确实是非常巧妙的。起调节作用的信号分子是细胞中某一氨基酸或喀咤的浓度,因此是转录调节中的微调整,好比无线电调谐器中的微调一样,只要稍加变动就可影响整个体系的功能。我们将在后面分析色氨酸基因操纵子结构时加以详述。6-1-3降解物对基因活性的调节操纵子学说的核心是使基因从表达抑制状态中解脱出来进行转录,是从负调节的角度来考虑基因表达调控的。那么,有没有从相反的角度进行正调节以提高基因的转录水平,使它由原来的低水平表达变成高水平表达的呢?这就是降解物抑制作用的调节。有葡萄糖存在的情况下,即使在细菌培养基中加入乳糖、半乳糖、阿拉伯糖或麦芽糖等诱导物,与其相对应的操纵子也不会启动,不会产生出代谢这些糖的酶来,这种现象称为葡萄糖效应或称为降解物抑制作用。为什么会产生这种效应呢?因为添加葡萄糖后,细菌所需要的能量便可从葡萄糖得到满足,葡萄糖是最方便的能源,细菌无需开动一些不常用的基因去利用这些稀有的糖类。葡萄糖的存在会抑制细菌的腺甘酸环化酶活性,减少环腺苜酸(cAMP)的合成,与它相结合的蛋白质,即环腺甘酸受体蛋白CRP又称分解代谢物激活蛋白CAP,因找不到配体而不能形成复合物。降解物抑制作用是通过提高转录强度来调节基因表达的,是一种积极的调节方式。6•1•4细菌的应急反应上述各点是细菌处于正常生活条件下的基因表达调节方式。所谓"正常”,也包括生活环境中缺少某一种或两种能源,但能找到其他代用物。可是,细菌有时会碰到紧急状况,比如氨基酸饥饿时,就不是缺少一二种氨基酸,而是氨基酸的全面匮乏。为了紧缩开支,渡过难关,细菌将会产生一个应急反应,包括生产各种RNA、糖、脂肪和蛋白质在内的几乎全部生物化学反应过程均被停止。实施这一应急反应的信号是鸟背四磷酸(ppGpp)和鸟背五磷酸(pppGpp)o产生这两种物质的诱导物是空载tRNA。当氨基酸饥饿时,细胞中便存在大量的不带氨基酸的tRNA,这种空载的tRNA会激活焦磷酸转移酶,使ppGpp大量合成,其浓度可增加10倍以上。ppGpp的出现会关闭许多基因,当然也会打开•些合成氨基酸的基因,以应付这种紧急状况。关于ppGpp的作用原理还不大清楚,一般认为RNA聚合酶有不同的构象,这些构象可以识别不同的启动子区,ppGpp与RNA聚合酶结合会使它的某些构象稳定下来,从而改变了基因转录的效率。也有人认为基因转录起始位点附近有一些保守序列,它们可能是ppGpp或有关调节蛋白的结合位点。当这些序列与ppGpp结合后,就不能.与RNA聚合酶相结合,使基因被关闭。ppGpp'jpppGpp的
99作用范围十分广泛,它们不是只影响一个或几个操纵子,而是影响一大批,所以它们是超级调控因子。6.2乳糖操纵子一一负控诱导系统6.2.1操纵子1961年,Jacob和Monod提出了操纵子模型,这是与特殊代谢途径有关的基因转录的协同调控模型。操纵子是基因表达和调控的单元,典型的操纵子包括:•结构基因(除调节基因以外的所有基因),编码那些在某一特定的生物合成途径中起作用的、其表达被协同调控的酶。•调控元件,如操纵序列,是调节结构基因转录的一段DNA序列。•调节基因,其产物能够识别调控元件,例如阻抑物,可以结合并调控操纵基因序列。6.2.2乳糖操纵子大肠杆菌能利用乳糖作为碳源,而利用乳糖作为碳源的酶只有当乳糖成为惟一的碳源时才会被合成。大肠杆菌乳糖操纵子(lactoseoperon)包括3个结构基因:Z、丫和A。这三个结构基因被同一个转录单元lacZYA所编码,它有一个启动子Plac。这种结构意味着乳糖操纵子的这三个结构蛋白是作为一个多顺反子的mRNA(在同一调控序列下含有不止一个编码区)一起表达的。lacZYA转录单元含有「•个操纵基因位点Olac,它位于Plac启动子5,端的-5至+21之间。该位点可被一个称作乳糖阻抑物的蛋白相结合.当该蛋白结合到操纵基因上时,便成为转录的强抑制物。乳糖阻抑物被一个独立的调节基因lacl所编码,lacl也是乳糖操纵子的一部分;lad位于Plac的上游。乳械阻抑物单体乳精阻抑物四聚体A半轧”背透性修乙威要转移”图L1.1乳糖操纵子的结构3个结构基因各决定一种酶:Z编码B-半乳糖甘酶;丫编码B-半乳糖背透过酶;A编码B-半乳糖甘乙酰基转移酶。6-半乳糖苗酶是一种B-半乳糖背键的专一性酶,除能将乳糖水解成葡萄糖和半乳糖外,还能水解其他半乳穗甘(如苯基半乳糖昔)。半乳糖昔透过酶的作用是使外界的B-半乳糖甘(如乳糖)透过大肠杆菌细胞壁和原生质膜进入细胞内,所以,如果用乳糖为大肠杆菌生长的惟•碳源和能源,这两种酶是必需的。半乳糖苜乙酰基转移酶的作用是把乙酰辅酶A上的乙酰基转移到B-半乳糖背上,形成乙酰半乳糖,它在乳糖的利用中并非必需。lad基因编码乳糖阻抑物,当以同亚基四聚体形式存在对具有活性。它对于lac操纵序列结合位点Olac具有很强的亲和力,并且对DNA也有较高的亲和力。Zac操纵序列位点由具有回文结构的28bp碱基组成(回文结构是指当一条链以5'到3’的顺序从左向右读对其DNA序列与它的互补链也以5,至3'的方向从右向左读时完全相同)。心从景・1・畲区SmRNADNA5,ATTAATaTGAGTTAOCTCMn'CATrAOCCACCCCAGOCITBWMCi1FA1OCIICCuGLggOTTGTGT8AATTGTCAGCMaImCA^YCACACf-3,区(•)TOSS・整子区he磨幼于区|TTTACA||tatgtt]・33区-10区
100■理性保守区|TTGACA|g]TATAAT|图6-14大胸杆菌lac操纵于启动区CRP-cAMP及-35区,-10区序列分析操纵序列的这种反向重复对称正好与由四个相同亚基组成的乳糖阻抑物的内部对称相匹配。当乳糖缺乏时,阻抑物占据了操纵序列的结合位点。乳糖阻抑物和RNA聚合酶能够同时结合到乳糖启动子和操纵序列位点上。乳糖阻抑物实际上使聚合前结合到乳糖启动子上的能力增加了两个数量级。这就意味着,当乳糖阻抑物结合到Olac操纵序列上时,聚合酶结合到相邻的Plac启动子序列上。当缺少诱导物时,乳糖阻抑物阻碍了几乎全部的lacZYA的转录而使之保持很低的转录水平。将乳糖加入细胞中后,细胞本身所含的低量的透性酶使它能吸收乳糖,半乳糖背酶则催化一些乳糖转化为异乳糖。异乳糖可以作为诱导物结合到乳糖阻抑物上。从而引起阻抑物四聚体构象的变化,从而降低其对乳糖操纵序列的亲和力,乳糖阻抑物从操纵序列上脱离下来可以使聚合酶(已经位于邻近的启动子上)迅速开始lacZYA基因的转录。BHL1.2乳糖、异乳糖ftHPTG的结构
101图LI.3语导物的结合使乳糖阻抑物失活因此,加入乳糖或合成诱导物如异丙基-B-D-硫代半乳糖昔(IPTG)能非常迅速地刺激乳糖操纵子结构基因的转录。若随后将诱导物清除掉则会导致诱导性转录的立即终止,这是因为游离的乳糖阻抑物会立即重新占据操纵序列上的位点,而lacZYARNA的转录物是极不稳定的。Plac启动子不是强启动子。其原因是Plac及其相关的启动子没有强的-35序列,其中一些甚至只有弱的TO的共有序列。为了实现高水平的转录,它们需要一种特定的激活蛋白即cAMP受体蛋白(CRP)的活化。图6-123',-cAMP的化学结构式cAMP即环式AMP,其在生物表达调控过程中起着重要作用。葡萄糖的降解代谢会抑制一些操纵子的转录。cAMP在细胞中的增加对这些操纵子的转录是有利的。葡萄糖降解物能抑制细胞内cAMP产生。这是因为ATP是cAMP的直接代谢前体,担任这种转化的酶是腺甘酸环化酶(adenylcyclase),此酶受葡萄糖代谢降解物的直接抑制从而造成cAMP不能产生。CRP也可称为分解代谢激活蛋白或CAP是以以二聚体形式存在的。当葡萄糖存在时,大肠杆菌不需要像乳糖这样的替代碳源。因此代谢操纵子如乳糖操纵子通常不被激活。原因是当葡萄糖存在时会降低细胞内cAMP的水平,CRP自身不能独立与DNA结合;当葡萄糖缺乏时,大肠杆菌细胞内cAMP水平上升,CRP结合到cAMP±oCRP-cAMP复合物可结合到紧邻RNA聚合酶结合位点上游的乳糖操纵子的启动子Plac上游。能使DNA双螺旋发生弯曲,有利于形成稳定的开放型启动子-RNA聚合酶结构,使转录效率提高50倍。时称序列中央
102图6-15CRP-cAMP与上・DNA位点鳍合后造成模板DNA沿财称序列中央发生大于8•的学曲6.2.3lac操纵于DNA的调控区域——户。区而阻遏物则是一个抗解链蛋白(antimeltingprotein),阻止形成开放结构,从而抑制RNA聚合酶的功能。lac操纵子小结•通常情况(葡萄糖供应正常)阻遏蛋白与操纵序列结合,基因不转录。•细胞外的乳糖通过透性酶吸收到细胞内;细胞内的B-半乳糖首酶将乳糖转变为异乳糖。异乳糖结合到乳糖阻抑物上使之从操纵序列上脱离,聚合酶迅速开始lacZYA基因的转录。这就是负控诱导。•然而,还需要细菌生长系统中缺少葡萄糖,使cAMP含量增加,CRP才能足够量的cAMP与之结合形成CRP-cAMP复合物结合于Plac上游。使DNA双螺旋发生弯曲,转录才可以有效地进行。6.3色氨酸操纵子与负控阻遏系统色氨酸操纵子包括色氨酸合成途经中相关的5个结构基因。该操纵子编码一个转录单元,即从色氨酸启动子Ptrp和操纵基因位点Otrp向下游转录出7kb的转录物。像许多涉及氨基酸生物合成的操纵子•样,色氨酸操纵子也具有当细胞内缺乏生物合成途径的产物色氨酸时,可使这些基因协同表达的进化系统。图L2.1色氨酸操纵手的结构和色氨酸阻抑物的功能色氨酸阻抑物独立的操纵子trpR编码的产物一色氨酸阻抑物,能与色氨酸操纵子的操纵基因位点特异性相互作用。操纵基因序列是色氨酸阻抑物的结合位点。操纵基因序列有部分对称序列。操纵基因的部分对称序列与色氨酸启动子序列在-21和+3碱基之间重叠。中心结合区是18个碱基的回文结构。色氨酸阻抑物能结合色氨酸并且只有当它与色氨酸结合形成复合物后才能结合到操纵基因上。阻抑物是含有两个亚基的二聚体。这一阻抑物二聚体含有一个中心区域和两个灵活的DNA解读头部(DNA-readinghead),这两个解读头部分别由一个亚基的竣基端形成。只有当色氨酸结合到阻抑物上时,这些解读头部才会处于证确的距离,侧链才会处于正确的构象从而与色氨酸操纵基因的DNA连续的大沟相互作用,这样色氨酸操纵子所编码的酶的终产物,即色氨酸才可作为共阻抑物起作用,并且通过终产物抑制自身的合成。该阻抑物将转录的起始减少了大约70倍。弱化子色氨酸操纵子对转录水平的调控与阻抑物有关。另外,如果在操纵基因和trpE基因编码序列之间的一段序列缺失,会导致基本转录水平和活化(解阻抑)一转录水平的上升。该段序列称为弱化子,它位于trpE起始密码子前面162nt的转录前导序列的123〜150位。弱化子是一个不依赖P
103因子的终止子区城,在一小段富含GC的回文结构之后是8个连续的U残基。如果这段序列能在RNA转录物中形成发夹结构,就可以作为一个高效的转录终止子,因而只有140bp的转录物被合成。如果弱化子缺失,转录将被通读,结构基因将被转录。+110+120+130+140AUACCCAGCCCGCCUAAUGAGCGGGCUUUUUUUUUG+110Yn+140AUACCCUUUUUUUU图6-21町》弱化子mRNA的终止区前导RNA结构色氨酸操纵子RNA的前导序列含有4个序列互补区,能形成不同的碱基配对的RNA结构。它们被称为序列1、2、3和4。弱化子发夹结构是序列3和4配对的产物(3:4结构)。序列1和2也是互补的,能形成另一个发夹结构1:2。然而序列2还和序列3互补。如果序列2和3形成2:3发夹结构,3:4弱化子发夹结构就不能形成,转录就不会终止。在正常情况下,1:2和3:4发夹结构的形成在能量上是有利的。前导肽前导RNA序列中含有一个有效的核糖体结合位点并能形成由前导RNA27一一68号碱基所编码的14个氨基酸的前导肽。这段前导肽的第10和第11个密码子编码连续的色氨酸残基。色氨酸是稀有氨基酸;通常两个色氨酸密码子连续出现的可能性很小,在色氨酸含量很低的情况下核糖体将会在这个位点停滞。前导肽的作用就是决定色氨酸的含量并控制转录的终止。弱化作用大肠杆菌中,翻译在mRNA边转录时边进行。色氨酸前导肽编码序列的3,端与互补序列1重叠,两个色氨酸密码子都在序列1内,终止密码子在序列1和2之间。由于色氨酸(色氨酸操纵子合成的肺的最终产物)是翻译过程中所必需的,因此细胞对它的含量很敏感,它决定了在mRNA中终止子(3:4)发夹结构是否形成。在色氨酸操纵子转录进行的过程中,RNA聚合酶在序列2的末端停滞直到核糖体开始翻译前导肽(即当前导肽开始翻译时,RNA聚合酶才又继续沿DNA模板链前进合成RNA)。在色氨酸含量很高的情况下,核糖体迅速在两个色氨酸密码子处插入色氨酸,这样翻译可直达前肽导末端。核糖体封闭了序列2,当RNA聚合酶把3区和4区转录出来时,3:4发夹得以形成,当RNA聚合酶到达终止序列时,由于3:4发夹使转录可能被终止。这一过程被称为弱化作用。』J1一/包梅的结杓*mkbbL2.2另一种情况是:如果色氨酸缺乏时,翻译过程中将缺少其氨酰一tRNA,核糖体将在两
104个色氨酸密码子上滞留,封闭了序列1。这使得序列2能自由地与序列3形成发夹结构(即抗终止子)。终止子(3:4)发夹结构不能形成,转录继续到trpE及其下游。因此终产物色氨酸含量的高低决定了转录是提早终止(弱化),还是继续转录完整个操纵子。弱化的重要性仅仅依靠弱化作用,色氨酸的存在就使色氨酸操纵子的转录被抑制了10倍。与色氨酸阻抑物的作用(70倍)合在一起,这就意味着色氨酸水平对色氨酸操纵子的表达施加了700倍的调节效果。至少在六种与氨基酸的生物合成相关的操纵子中有弱化作用。例如his操纵子含有编码一个有连续7个组氨酸密码子的多肽的前导序列。并不是所有这些操纵子都像色氨酸操纵子那样有协同调控。例如his操纵子就没有阻抑物-操纵基因调控,弱化作用是其惟一的反馈调控机制。6•4转录后调控基因表达的转录调控是生物最经济的调控方式一一既然是用不着某种蛋白质,就用不着转录其mRNA。但转录生成mRNA以后,再在翻译或翻译后水平进行"微调”,是对转录调控的补充,它使基因表达的调控更加适应生物本身的需求和外界条件的变化。6•6•1翻译起始的调控遗传信息翻译成多肽链起始于而mRNA上的核糖体结合位点(RBS)。所谓RBS,是指起始密码子AUG上游的一段非翻译区。在RBS中有SD(Shine-Dalg-arno)序列,长度一般为5个核甘酸,富含G、A,该序列与核糖体16SrRNA的3'端互补配对,促使核糖体结合到mRNA上,有利于翻译的起始。RBS的结合强度取决于SD序列的结构及其与起始密码AUG之间的距离。SD与AUG之间相距•般以4-10个核甘酸为佳,9个核甘酸最佳。此外,mRNA的二级结构也是翻译起始调控的重要因素。因为核糖体的30S亚基必须与mRNA结合,要求mRNA5'端有一定的空间结构。SD序列的微小变化,往往会导致表达效率上百倍甚至上千倍的差异,这是由于核甘酸的变化改变了形成mRNA5'端二级结构的自由能,影响了核糖体30S亚基与mRNA的结合,从而造成了蛋白质合成效率上的差异。6•4•2稀有密码子对翻译的影响大肠杆菌DNA更制时,冈崎片段之前的RNA引物是由dnaG基因编码的引物醒催化合成的,细胞对这种酶的需求量不大,而引物酶过多对细胞是有害的。已知dnaG和rpoD及rpsU(30S核糖体上的S21蛋白)属于大肠杆菌基因组上的同一个操纵子,而这3个基因产物在数量上却大不相同,每个细胞内仅有50个拷贝的dnaG蛋白,却有2800个拷贝的rpoD蛋白,更有高达40000个拷贝的rpsU蛋白。细胞通过翻译调控,解决了这个问题。即由基因转录出来的三个蛋白相应的mRNA拷贝数大体相同,由于翻译的调控使得蛋白的拷贝数发生了很大的变化。研究dnaG序列发现其中含有不少稀有密码子。分别计算大肠杆菌中25种结构蛋白和dnaC、rpoD序列中64种密码子的利用频率,可以看出dnaG与其他两类有明显不同(表6T1)。很明显,稀有密码子AUA在高效表达的结构蛋白及。因子中均极少使用,而在表达要求较低的dnaG蛋白中使用频率就相当高。此外,UCG(Ser)、CCU(Pro),CCC(Pro),ACG(Thr),CAA(Gln),AAT(Asn)和AGG(Arg)等7个密码子的使用频率在不同蛋白中也有明显差异。我6-11几种,白质中异亮氨酸田码子使用频率比较蛋白质AUU/%AUC/%AUA/%结构罐白37621。亚基26・740DnaG蛋白363232许多调控蛋白在细胞内含量也很低,这些蛋白的编码基因中密码子的使用频率和dnaG相似,而明显不同于结构蛋白。由于细胞内对应于稀有密码子的tRNA较少,高频率使用这些密码子的基因翻译过程容易受阻,影响了蛋白质合成的总量。
1056,4•3市叠基因对翻译的影响重卷基因最早在大肠杆菌噬菌体中X174中发现,例如B基因包含在A基因内,E基因包含在D基因内,用不同的阅读方式得到不同的蛋白质。当时认为重登基因的生物学意义是它可以包含更多的遗传信息,后来发现丝状RNA噬菌体、线粒体DNA和细菌染色体上都有重叠基因存在,暗示这一现象可能对基因表达调控有影响。现用trp操纵子中的trpE基因和trpD基因之间的翻译偶联现象来说明这个问题。trp操纵子由5个基因(trpE、D、C、B、A)组成,在正常情况下,操纵子中5个基因产物是等量的,但trpE突变后,其邻近的trpD产量比下游的trpBA产量要低得多。研究trpE和trpD以及trpB和trpA两对基因中核甘酸序列与翻译偶联的关系,发现trpE基因的终止密码子和trpD基因的起始密码子共用一个核甘酸。trpE苏氨酸苯丙氨酸终止ACUUUCUGAUGG——CUAUGGCU甲硫氨酸一丙氨酸一trpD由于trpE的终止密码子与trpD的起始密码重叠,trpE翻译终止时核糖体立即处在起始环境中,这种重叠的密码保证了同一核糖体对两个连续基因进行翻译的机制。实验证明,偶联翻译可能是保证两个基因产物在数量上相等的重要手段。翻译的阻遏蛋白质阻遏或激活基因转录的例子已经屡见不鲜,那么,蛋白质是否也能对翻译起类似的调控作用呢?在大肠杆菌RNA噬菌体QP中发现了这种现象。QP噬菌体基因组包含有3个基因,从5'到3'方向依次是与噬菌体组装和吸附有关的成熟蛋白基因也外壳蛋白基因和RNA复制酶基因。当噬菌体感染细菌,RNA进人细胞后,这条称为(+)链的RNA立即作为模板指导合成复制酶,并与宿主中已有的亚基结合行使复制功能。但是,QB(+)RNA链上此时己有不少核糖体,它们从5'向3'方向进行翻译,这无疑影响了复制随催化的从3'向5'方向进行的(-)链合成。克服这个矛盾的办法便是由QB复制酶作为翻译阻遏物进行调节。体外实验证明,纯化的复制酶可以和外壳蛋白的翻译起始区结合,抑制蛋白质的合成。由于复制酶的存在,核糖体便不能与起始区结合,但已经起始的翻译仍能继续下去,直到翻译完毕,核糖体脱落,与(+)RNA3‘端结合的复制前便开始了RNA的复制。这里复制酶既能与外壳蛋白的翻译起始区结合,又能与(+)链RNA的3,端结合。序列分析表明,这两个位点上都有CUUUU-AAA序列,能形成稳定的茎-环结构,具备翻译阻遏特征。6-6-6魔斑核背酸水平对翻译的影响实验证明,核糖体蛋白(R蛋白)通过反饿阻遏作用保证所有R蛋白合成的协同进行。那么,细胞如何保证蛋白质合成的总速度与蛋白质合成机器主要成分rRNA的合成速率相一致,保证在不进行蛋白质合成时没有RNA的合成?起这个调控作用的最早信号是不载有氨基酸的tRNA。大肠杆菌营养缺陷型(fp"hk")在缺少任何一-种必需氨基酸的培养基上生长时,不但蛋白质合成速度立即下降,RNA合成速度也下降。由于色氨酸和组氨酸不是RNA的前体,因此认为RNA合成速度下降是蛋白质合成受阻后的次级反应。研究另一个大肠杆菌突变株发现,当氨基酸供应不足时,这个突变株细胞内蛋白质合成虽然停止了,但RNA的合成速度却没有下降。科学上把前一种现象称为严紧控制(基因型刊”);后一种现象称为松散控制(基因型Z")reo刊•和讨-菌株除上述生理现象不同之外,缺乏氨基酸时讨”菌株能合成鸟节四磷酸(PPGpp)和鸟甘五磷酸(PpPGpp),词“菌株则不能合成鸟背酸。
106因为这两种化合物是在层析谱上检出的斑点,当时称为魔斑(magics四t)。在旺盛生长的细胞中约有65%-叨机RNA是载有氨基酸的。当氨基酸缺乏时,不负载氨基酸的tRNA增多,这种不负载氨基酸的tRNA仍能与核糖体的A位结合,核糖体上不负载氨基酸的tRNA是细胞产生严紧控制的信号。在正常的蛋白质合成过程中,将AA-tRNA运转到正在延伸的多肤上需要Gm,也许由于这一反应的停止,大量GTP便被用作合成魔斑核苛酸的前体。GTP+Am弓pppGpp+AMP十ppGpp参与这个反应的除洲基因所编码的•AW-GTP-3'-焦磷酸转移酶外,还需要翻译起始因子Emu和EFG等。虽然pPGpp是多效性的,但它的主要作用可能是影响RNA聚合酶与启动子结合的专一性,从而成为细胞内严紧控制的关键。有人将ppGpp和cAMP这类物质称为警报素(alamone)。当细胞缺乏氨基酸时产生pPGpp,可在很大范围内做出如抑制核糖体和其他大分子合成等应急反应,活化某些氨基酸操纵子的转录表达,抑制与氨基酸运转无关的系统,活化蛋白水解酶等,以节省或开发能源,渡过难关。思考题:乳糖操纵子的调控方式。色氨酸纵子的调控方式。第七章真核基因的表达调控教学内容:真核生物的基因结构与转录活性;真核基因的转录调控;转录后的基因调控。教学目的:让学生了解真核基因的表达调控的重要步骤。教学重点:真核基因的表达调控与原核基因表达调控的主要区别。讲课具体内容环境因素对原核细胞的调控起到决定性的作用。环境因子是调控的诱导物,群体中每一个细胞对环境变化的反应是直接的和一致的。对于大多数真核细胞来说,基因表达调控最明显的特征是能在特定时间和特定的细胞中激活特定的基因,实现"预定”的、有序的、不可逆转的分化、发育过程,并使生物的组织和器官保持正常功能。这是生命活动规律决定的,环境因素在其中作用不大。真核生物基因调控可分为两大类,第一类是瞬时调控或称可逆性调控,它相当于原核细胞对环境条件变化所做出的反应,包括某种底物或激素水平升降时,或细胞周期不同阶段中酶活性的调节;第二类是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的进程。根据基因调控发生的先后次序,可将其分为转录水平调控及转录后水平调控。后者又进一步分为RNA加工成熟过程的调控、翻译水平的调控及蛋白质加工水平的调控。①诱发基因转录的信号、②基因调控在哪一步(模板DNA的转录、mRNA的成熟或蛋白质合成)实现以及③不同水平基因调控的分子机制是研究基因调控的主要内容。7•1真核生物的基因结构与转录活性真核细胞与原核细胞在基因转录、翻译及DNA的空间结构方面存在的差异:(1)在真核细胞中,成熟mRNA为单顺反子mRNA,很少存在原核生物中常见的多基因操纵子形式。(2)真核细胞DNA与组蛋白和大量非组蛋白相结合,只有一小部分DNA是裸露的。(3)高等真核细胞DNA中很大部分是不转录的,大部分真核细胞的基因中间存在不被翻译的内含子。(4)真核生物能够有序地根据生长发育阶段的需要进行DNA片段重排,还能在需耍时增加细胞内某些基因的拷贝数,这种能力在原核生物中是极为鲜见的。(5)在原核生物中,转录的调节区都很小,大都位于转录起始位点上游不远处,调控蛋白结合到调节位点上可宜接促进或抑制RNA聚合的对它的结合。在真核生物中,基因转录的调节区则大得多,它们可能远离核心启动子达儿百个甚至上千个碱基对。虽然这些调节区也
107能与蛋白质结合,但是并不直接影响启动子区对于RNA聚合酶的接受程度,而是通过改变整个所控制基因5,上游区DNA构型来影响它与RNA聚合酶的结合能力。(6)真核生物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质。原核生物中不存在这样严格的空间间隔。(7)许多真核生物的基因只有经过复杂的成熟和剪接过程,才能被顺利地翻译成蛋白质。7.1.1外显子和内含子的可变调控通常情况,一个基因的转录产物通过组成型剪接只能产生一种成熟mRNA,编码惟一的多肽。但是,有一些真核生物基因的原始转录产物可通过不同的剪接方式,产生不同的mRNA,并翻译不同的蛋白质。这就是选择性剪接。另外,一些核基因由于转录时选择了不同的启动子,可产生不同的mRNA表现为表达水平的高低。小鼠淀粉酶基因表达:由S外显子起始的转录物是由L外显子起始转录产物的100倍以编码区DNA5禽28kb区45记罩始特量产,.液.鼠囱d—h一Hi始转录产物图7-9不同外*子的使用导致a-淀给*某因在不同组织中表达水平很不相同L_7.1.2DNA水平上的基因表达调控在个体发育过程中,DNA会发生规律性变化,从而控制基因表达和生物的发育。成熟红细胞能产生大量的可翻译成熟珠蛋白的mRNA,它的前体细胞是不产生珠蛋白的。这种变化是由于基因本身或者是基因的拷贝数发生了永久性变化所调控的。这样的DNA水平的调控是真核生物发育调控的一种形式,这包括基因丢失、扩增、重排和移位。这与转录和翻译水平的调控是不同的,这种调控使基因组发生了改变。8.1.2.1开放型活性染色质结构引起转录真核基因的活跃转录是在染色质上进行的。准备转录时,染色质在特定区域被解旋松弛,引起核小体结构和DNA局部结构的变化,并导致结构基因暴露,促进转录因子与启动子区DNA的结合,诱发基因转录。暴露的DNA易受核酶的攻击,研究发现,活跃表达基因所在染色质上含有DNA酶1超敏感位点,这些超敏感位点大多位于基因5'端启动子区。非活性状态基因5'端相应位点不表现对DNA酶I的超敏感性。9.1.2.2基因扩增基因扩增一一为了满足某个阶段生长发育的需要,基因的拷贝数专一性大量增加的现象,是基因活性调控的一种方式。例如,非洲爪蟾的卵母细胞中原有rRNA基因(rDNA)约500会拷贝,为了满足卵裂期和胚胎期合成大量蛋白质对核糖体的需要,基因大量复制rDNA使拷贝数达到200万,扩增约4000倍。7-1*3DNA甲基化与基因活性的调控DNA甲基化修饰途径可能存在于所有高等生物中并与基因表达调控密切相关。大量研究表明:
108DNA甲基化能关闭某些基因的活性,去甲基化则诱导了基因的重新活化和表达。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。7.•1•3•1DNA的甲基化DNA甲基化修饰现象广泛存在于多种有机体中。这个过程通过改变基因的表达,参与细胞的生长、发育过程及X染色体失活等的调控。DNA甲基化主要形成5-甲基胞嗑嗟(5-mC)和少量的N'-甲基腺喋吟(N,-mA)及7-甲基鸟喋吟(7-mG)(图7-13),8.1-3-2DNA甲基化抑制基因转录的机理DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用;抑制了转录因子与启动区DNA的结合效率。用组蛋白H1与含CCGG序列的甲基化或非甲基化DNA实验后发现:甲基化与非甲基化DNA的构型存在着很大的差别。而甲基化达到一定程度时会发生从常规的B-DNA向Z-DNA的过渡。又由于Z-DNA结构收缩,螺旋加深,使许多蛋白质因子赖以结合的元件缩入大沟而不利于基因转录的起始。有实验用序列相同但甲基化水平不同的DNA为材料,比较其作为RNA聚合酶转录模板的活性,发现甲基的引入不利于模板与RNA聚合酶的结合,降低了其体外转录活性。5-甲基胞喀咤在DNA上并不是随机分布的,基因的5'端和3'端往往富含甲基化位点,而启动区DNA分子匕的甲基化密度与基因转录受抑制的程度密切相关(图7-14)o对于弱启动子来说,稀少的甲基化就能使其完全失去转录活性。当这一类启动子被增强时(带有增强子),即使不去甲基化也可以恢复其转录活性。若进一步提高甲基化密度,即使增强后的启动子仍无转录活性。因为甲基化对转录的抑制强度与MeCPl(methylCpG-bindingprotein1)结合DNA的能力成正相关,甲基化CpG的密度和启动子强度之间的平衡决定了该启动子是否具有转录活性。启动子强度甲基化低密度CpG高密度CpG弱-?泮?!???????????况*・・%・•・朋co岛图7-14DNA甲基化对基因转录的抑制作用箭头粗细表示转录活性强弱,空心圆表示DNA未甲基化,小黑点表示DNA甲基化,椭圆形表示MeCPI松散结合.长方形表示MeCPI紧密结合DNA的甲基化还会提高突变频率。真核生物中5-mC主要出现在5'-CpG-3'序列中,5-mC脱氨后生成的胸腺喀啜(T),不易被识别和矫正。因此,特定部位的5-mC脱氨基反应,将在DNA分子中引入可遗传的转化(CfT)。若位点突变发生在DNA功能区域,就可能造成基因表达的紊乱”在多种癌细胞中,p53基因第273位密码子含CpG序列,常由CGT突变为CAT或TGT(ArgfHis或Cys)»9.-2真核基因的转录调控真核基因的调控主要也是在转录水平上进行的,是因为特定的反式作用因子(trans-actingfactor,又称跨域作用因子)与顺式作用元件(cis-acting,element)相互作用而进行的调控。7.2.1顺式作用元件:真核生物启动子和增强子。它们由若干DNA序列元件组成,它们常与特定的功能基因连锁在一起“1.启动子(Promoter)真核基因启动子由核心启动子和上游后动子两个部分组成,是在基因
109转录起始位点(+1)及其5'上游大约100〜200bp以内的一组具有独立功能的DNA序列,是决定RNA聚合酶II转录起始点和转录频率的关键元件。(1)核心启动子(corepromoter)是指保证RNA聚合酶11转录正常起始所必需的、最少的DNA序列。包括转录起始位点及转录起始位点上游-25〜-30bp处的TATA盒。核心启动子单独起作用时,只能确定转录起始位点并产生基础水平的转录。(2)上游启动子元件(upstreampromoterelement,UPE)包括通常位于-7Obp附近的CAAT盒(CCAAT)和GC盒(GGGCGG)等,能通过TFIID复合物调节转录起始的频率,提高转录效率。1.增强子及其对转录的影响增强子是指能使与它连锁的基因转录频率明显增加的DNA序列。病毒、植物、动物和人类正常细胞中都发现有增强子存在。作为基因表达的重要调节元件,增强子通常具有下列特性:(1)增强效应十分明显一般能使基因转录频率增加10~200倍,有的可以增加上千倍。(2)增强效应与其位置和取向无关不论增强子以什么方向排列(5'-3'或3'-5'),甚至与靶基因相距3000bp或在靶基因下游,均表现出增强效应。(3)大多为重复序列一般长约50bp,适合与某些蛋白因子结合。其内部常含有一个产生增强效应时所必需的核心序列:(G)TGGA/TA/TA/T(G)。(4)没有基因专一性,可以在不同的基因组合上表现增强效应。(5)许多增强子受外部信号的调控,如金属硫蛋白基因启动区上游所带的增强子,就可以对环境中的锌、镐浓度做出反应。增强子的功能受DNA双螺旋空间构象的影响。增强子可能有如下3种作用机制:1.影响模板附近的DNA双螺旋结构,导致DNA双螺旋弯折或在反式因子的参与下,以蛋白质之间的相互作用为媒介形成增强子与启动子之间"成环”连接,活化基因转录。2.将模板固定在细胞核内特定位置,如连接在核基质上,有利于DNA拓扑异构施改变DNA双螺旋结构的张力,促进RNA聚合酶n在DNA链上的结合和滑动。3.增强子区可以作为反式作用因子或RNA聚合酶且进入染色质结构的"入口”。7.2.2反式作用因子:参与调控靶基因转录效率的蛋白质,它们能识别或者结合在各类顺式作用元件核心序列上(如:上游调控元件或增强子区域)。这些因子有两种独立的活性:首先它们特异地与DNA结合位点相结合,然后激活转录。这些活性可以独立分配给特定的蛋白结构域,分别称作DNA结合结构域和激活结构域。转录激活功能是与其DNA结合活性相分离的。它们在蛋白质的不同区域。7.2.2.1DNA结合结构域1.螺旋-转折-螺旋(helix-turn-helix,H-T-H)结构这一类蛋白质分子中有至少两个a螺旋,中间由短侧链氨基酸残基形成"转折”,近竣基端的a螺旋中氨基酸残基的替换会影响该蛋白质在DNA双螺旋大沟中的结合。与DNA相互作用时,同源域蛋臼的第一、二两个螺旋往往靠在外侧,其第三个螺旋则与DNA大沟相结合,并通过其N-端的多余臂与DNA的小沟相结合(图7-18).图7-18同源域蛋白通过其第三个螺旋与双健DNA的大沟相结合,其N端的多余胃部分则与DNA的小沟相结合.提赢了稳定性
1101.锌指结构域这种结构域有两种形式,"CzHJ型锌指通过2个半胱氨酸和2个组氨酸残基固定,这四个残基与锌离子在空间上形成一个四面体结构。这种锌指折会形成一个紧密的结构,由二条B链和一个a-螺旋组成,a-螺旋与DNA大沟结合。该a-螺旋区域上含有保守的碱性氨基酸,负责与DNA的结合。另一锌指结构是锌离子与4个半胱氨酸结合,它出现在一百多种类固醇激素受体转录因子中。这些因子由同型或异型的二聚体组成,其中每一单体包含2个C,锌指结构。两个单体通过锌离子稳定折叠成更复杂的构象,再把每个单体的a-螺旋插入到DNA的连续大沟中。2.碱性结构域在许多DNA结合蛋白中都发现了碱性结构域,它通常是与亮氨酸拉链或HLH基序中的一个联合在一起的,结果被称做碱性亮氨酸拉链(bZIP)或碱性HLH蛋白。蛋白的二聚作用使二个碱性结构城相邻,进而可与DNA发生作用。7.2.2.2二聚体结构域1.亮氯酸拉链亮氨酸拉链的肽链上每相隔七个残基就会有一个疏水的亮氨酸残基,这些残基位于DNA结合域的C端-a螺旋上,这样a-螺旋的侧面每两圈就会出现一个亮氨酸,形成一个疏水的表面。结果在a-螺旋的疏水表面间就可以互相作用,形成二聚体。这种相互作用形成一个卷曲的卷曲结构(coiled-coi[structure)。bZIP转录因子包含一个碱性的DNA结合区域,其N端与亮氨酸拉链相连,这也可以被看作是a-螺旋C端的延伸。每个a-螺旋相连的碱性结构域形成一个对称的结构,沿DNA相反的方向延伸并与对称的DNA识别位点发生作用,最终像一个夹子夹在DNA±o亮氨酸拉链在一些利用DNA结合结构域的蛋白中也可以不通过碱性结构域而作为二聚体结构域使用,包括一些同源域蛋白。图N1.3bZIP蛋白的亮氨酸拉链和碱性结构域二聚体2.螺旋一环-螺旋(HLH)结构域这一结构在总体上与亮氨酸拉链相似,只是它的二个a-螺旋被一个非螺旋的多肽环分成二个单体蛋白,C端a-螺旋一侧的疏水残基可以二聚化。与亮氨酸拉链一样,HLH结构也经常与碱性结构域相邻,以形成DNA结合所需的二聚体。7.2.2.3转录激活结构域1.酸性激活结构域通过比较酵母Gcn4和Gal4的转录激活结构域、哺乳动物糖皮质激素受体以及疤疹病毒激活子VP16发现它们都含有很高比例的酸性氨基酸,这样的结构域被称作酸性激活结构域,且是许多转录激活结构域的特征。2.富含谷氨酰胺结构域富含谷氨酣胺的结构域是在转录因子SP1的二个激活区域上首次发现的。与酸性结构域一样,谷氨酰胺残基所占的比例很重要。3.富含脯氨酸结构域在一些转录因子中所发现的富含脯氨酸结构域,与谷氨酰氨相似,有一个能激活转录的连续脯氨酸残基链。7.2.2.4阻抑物结构域
111转录的阻抑有可能是通过间接地对激活因子功能的干扰而实现的,有以下儿种情况:阻断了激活因子的DNA结合位点(与原核生物的阻抑蛋白一样).并非阻碍DNA结合而是掩盖了激活结构域。哺乳动物甲状腺激素受体的结构域在缺少甲状腺激素的情况下可以阻抑转录,而在与配体结合后又可激活转录。Wilms癌基因WT1的产物是一个抑癌蛋白,这个抑癌蛋白就有一个特定的富腌氨酸阻抑结构域。7.2.3转录调控的对象激活结构城多样性的存在给我们提出了一个问题,即在起始转录复合体中它们的调控对象是相同的还是不同的?酸性激活结构域可以从下游的增强子位点激活转录,而富含脯氨酸结构域的激活力很弱,富含谷氨酰氨根本无法激活;在酵母中富含脯氨酸的结构域和酸性结构域具有活性,而富含谷氨酰胺的结构域则没有活性,这些都表明激活结构域有着不同的调控对象。不同的转录激活因子调控的对象是不一样的,可能的情况有以下几种:染色质结构;•与TFHD作用;•与TFnB作用;•对TFIIH复合体的调整和作用。不同的激活结构域有着不同的调控对象,而且转录起始和延伸过程的任何组分或阶段都可能成为调控的对象,从而实现转录的多阶段调控。7.2.4转录调控实例1.组成性转录因子:SP1SP1与一段富含GC的保守序列GGGCC沿相连,是一种组成性转录因子。SP1存在于所有的细胞类型中,包含3个锌指结构以及2个富含谷氨酰胺转录激活结构域。SP1的富含谷氨酰胺结构域与TAFullO发生特异性作用,而TAFnllO与TATA结合蛋白(TBP)相结合组成TFHD。这就是SP1如何调控起始转录复合体的一种方式。mN2.1类画呼*・磁帚《(皮版at*受体的徵式图2.激素调控:类固醇激素受体许多转录因子是由激素激活的。这些激素通常由一类细胞分泌,然后将信号转移给另一类细胞。类固醇激素是脂溶性的,可以穿过细胞膜与被称作类固醇激素受体的转录因子相互作用。在没有类固醇激素存在的条件下,该受体与抑制蛋白结合,游离在细胞质中。当类固醇激素与受体结合后,可以使受体从抑制蛋白上游离出来,然后受体二聚化,进而转移到细胞核中。受体上的DNA结合结构城与特定的DNA序列或反应
112元件作用,从而激活目标基因。相关受体中比较重要的有:糖皮质激素、雌性激素、视黄酸和甲状腺激素受体。甲状腺激素受体在没有激素结合的情况下自身是阻抑蛋白,一旦与激素结合后可转化为转录激活因子。1.磷酸化调控:STAT蛋白许多激素并不穿过细胞,它们与细胞表面的受体结合,通过称为信号转导的过程将信号传递给细胞内的蛋白,该过程通常涉及到蛋白磷酸化。Y-干扰素通过激活一种称为JAK的激酶诱发转录因子STAT1a的磷酸化。若STAT1a没有磷酸化,它只以单体的形成存在于细胞质中并且没有转录活性。然而它的一个特定酪氨酸残基发生磷酸化后,便能够形成同型二聚体,并从细胞质转移到细胞核中,进而激活在启动子处含有一保守DNA结合基序的目标基因的表达。用N2.2由STATlar”录因子的.融化及二.化引国的y一干扰案的W录.活理*2.转录延伸:HIVTat•人类免疫缺陷病毒(HIV)编码一种称为Tat的激活蛋白,该蛋白为HIV基因的大量表达所必需。Tat与RNA上的一段称为TAR的茎环结构结合。TAR是HIVRNA5'端的转录起始点后的一段不翻译区域。在哺乳动物细胞中Tat所起的主要作用表现在转录延伸的过程中,若没有Tat的存在,RNA聚合醐II转录复合体将因进程过慢而使HIV的转录过早终止。Tat可与RNA结合因子一起以复合体形式结合在转录物的TAR序列上,Tat-RNA复合体可以向后成环,并与装配在启动子处的新形成的转录起始复合体作用,这种作用导致TFIIH的激酶活性被激活,结果RNA聚合酶H的梭基端结构域(CTD)实现磷酸化,使得RNA聚合酶前进,使其完成HIV转录单位的阅读,最终实现HIV蛋白的大量合成。田N2.3HIVT•,墨白激活转业延伸的机制3.细胞决定:myoD肌肉细胞来自于称为体节(somites)的中胚层细胞。在机体能够通过细胞分化形成骨胳肌肉细胞(称为生肌节)之前,由体节负责肌肉细胞的生成,该过程称为细胞决定。myoD最初是作为一个在(成肌细胞,myoblast)未分化细胞中表达并负责肌肉形成与执行细胞决定的基因被鉴定出来的,它的过量表达可以使成纤维细胞(在许多组织中的基质铺垫细胞)变成表达肌细胞特异基因的类肌肉细胞和类生肌节。MyoD蛋白可以直接激活肌细胞特异基因的表达,同时也可激活P21WAF1/CIP1的表达。P21WAF1/CIP1是一个依赖细胞周期蛋白的激酶(cyclin-dependentkinases,
113CDK)的小分子抑制因子,该因子对CDK活性的抑制可以使细胞周期停滞在G1期(细胞为复制作准备的时期,称为间隙期)。所以说myoD的表达是细胞退出细胞周期的原因,而退出细胞周期正是已分化肌细胞的特征。现在已发现的四种基因myoD、myogenin、myf5和mrf4中的任一基因的表达都可使成纤维细胞转化为肌细胞,它们所编码的蛋白都属于HLH转录因子家族的成员。MyoD与组成性HLH转录因子E12和E47结合成异型二聚体时活性最强。通过不同的组合,这些HLH型的转录因子能够产生多种各自具有不同功能与作用的同型或异型的转录因子,这些因子可以受一种被称为Id的抑制因子调控。该Id缺乏与DNA结合的结构域,但都含有HLH的二聚化结构域,当它与MyoD和相关蛋白结合后,形成的异型二聚无法与DNA结合,因此也就无法调控转录。1.胚胎发育:同源域蛋白同源框是一段保守的DNA序列,编码一种称做同源异型域的螺旋-转角-螺旋的DNA结合蛋白。同源异型域最初是在果蝇同源异型基因编码的转录因子中发现,该基因负责身体各部分的正确分化o例如,同源异型基因中的一种Antennapedia的突变可使果蝇在应该长触角的地方长出腿来。这些基因对胚胎的空间构型的形成非常市要。同源框序列在真核生物的许多种中非常保守,含有同源框的基因在哺乳动物的发育中起着重要作用。在果蝇和哺乳动物中,同源异型基因被排列在同源基因相同顺序的基因簇中,这些基因同系物在胚胎的前后轴间也以相似的顺序进行表达。以上现象说明由保守同源异型基因所编码的DNA结合结构域是转录因子的特征,而转录因子在胚胎发育的过程中有着固定的功能。7•3转录后的基因调控转录调节是基因表达调控的最重要方式,但还有其他方式。1、真核基因有插入序列,结构基因被分割成不同的片段。2、真核生物基因转录在核内进行,翻译在细胞质中进行,有mRNA的运送过程。基因表达的过程中可能被调控,步骤越多产生调控的形式也会越多。真核生物转录之后到达翻译的路比原核生物长,所经步骤也多,因此,基因的转录后调控就显得更为重要。RNA的加工成熟和蛋白质合成,在真核基因调控中起着重要作用。2•3•1RNA的加工成熟各种基因的转录产物都是RNA,无论是rRNA,tRNA,还是mRNA,初级转录产物只有经过加工,才能成为有生物功能的活性分子。7«3•1•IrRNA和tRNA的加工成熟rRNA加工有两个内容,一个是分子内的切割,另一个是化学修饰。真核生物的rRNA基因转录时先产生一个45s的前体rRNA,然后被核酸酶逐渐降解,形成成熟的18S、28S和5.8SrRNA.rRNA基因转录主要在细胞核仁内进行,初级转录产物45S前体rRNA很快就会被加工降解,生成不同相对分子质量的成熟rRNA。rRNA的化学修饰主要是核糖甲基化。tRNA基因转录时也可能先生成前体tRNA;然后再进行加工成熟。tRNA基因的初级转录产物在进入细胞质后,首先经过核苜的修饰,生成4.5S前体tRNA,再剪接成为成熟tRNA(4S)o7•3•1•2•mRNA的加工成熟编码蛋白质的基因转录产生mRNA。这类基因产物在转录后要进行一系列的加工变化,
114才能成为成熟的有生物功能的mRNA。这些加工主要包括在mRNA的5'末端加"帽子”,在其3’末端加上poly(A),进行RNA的剪接以及核甘酸的甲基化修饰等。由于mRNA的这些结构与它作为蛋白质合成模板的功能有密切关系,所以是基因表达的重要调控环节。编码蛋白质的基因转录时首先生成前体pre-mRNA(或称核不均一RNA,hnRNA),然后再加工剪接为成熟mRNA(已介绍过)。7•3•1•3真核生物基因转录后加工的多样性真核生物的基因可以按其转录方式分为两大类:即简单转录单位和复杂转录单位。这两种转录方式虽然最终都产生蛋白质,但它们的转录后加工方式是不同的。1•筒单转录单位这类基因只编码产生一个多肽,其原始转录产物有时需要加工,有时则不需要加工。这类基因转录后加工有3种不同形式(图7-44)。第一种简单转录单位,如组蛋白基因,它们没有内含子,因此不存在转录后加工问题,其mRNA3'末端没有poly(A),但有一个保守的回文序列作为转录终止信号。已知高等真核生物有3种不同的组蛋白,即与DNA复制有关的、与复制无关的和组织特异性组蛋白。第二种简单转录单位包括腺病毒蛋白IX、a-干扰素和许多酵母蛋白质基因,它们没有内含子,所编码的mRNA不需要剪接,但需要加poly(A)。第三种简单转录单位包括a和p-珠蛋白基因及许多细胞蛋白基因,这些基因虽然都有内含子,需要进行转录后加工剪接,还要加poly(A),但它们只产生一个有功能的mRNA,所以仍然是简单转录单位。形式poly(A)购辑实例超强白腺病毒蛋白IX干扰素许多・母基因a、0一珠串白大・楂M因插入顺序xhapoiy(A)位点DNA,■■■编码区,二:I~~箝录起始点:■转录终止点.图7-44真核生物基因转录后加工的3种主要形式2•复杂转录单位含有复杂转录单位的主要是一些编码组织和发育特异性蛋白质的基因,它们除了含有数量不等的内含子以外,其原始转录产物能通过多种不同方式加工成两个或两个以上的mRNA。基因mRNAs品幽忽g轻链图7-45肌球蛋白减性轻链基因剪接的多样性
115(1)利用多个5'端转录起始位点或剪接位点产生不同的蛋白质。小鼠和鸡的肌球蛋白轻链基因、果蝇EH8基因、脱氢的基因、小鼠唾液与肝脏a-淀粉酶基因、田鼠乙酰辅酶A基因等都属于这种成熟方式。图7-45说明肌球蛋白碱性轻链基因选用了不同的51转录起始位点及剪接不同外显子产生蛋白质异构体LC1和LC3的过程。由于选用不同的转录起始位点,还导致了小鼠a-淀粉酶基因的组织特异性。(2)利用多个加poly(A)位点和不同的剪接方式产生不同的蛋白质。这类基因调控点不在5'末端和内含子的不同剪接。而在于有两个或多个加poly(A)位点,因此可通过不同的剪接方式得到不同的蛋白质。这类基因的有腺病毒晚期基因等。以大鼠降钙素基因为例,它编码与血钙代谢有关的蛋白质。该基因有一个转录起始位点和5个外显子,两个加poly(A)位点。如果初级转录产物以0—1—2—3号外显子连接在一起,并利用外显子3后面的poly(A)位点,就产生降钙素mRNA。但当初级转录产物以0—1—2—3—4—5号外显子连接在一起,并利用外显子5以后的加poly(A)位点,就产生了编码与降钙素基因表达有关的多肽CGRP的mRNA(图7-46).—AAA(A).成焦mRNA纺叁I]图7-46前mRNA不同的剪接方式造成了不同组织中不同的降钙素样蛋臼7•3•1•4mRNA有效性的调控真核生物能否长时间、及时地利用成熟的mRNA分子翻译出蛋白质以供生长、发育的需要,是与mRNA的稳定性以及屏蔽状态的解除密切相关的。原核生物mRNA的半衰期很短,平均大约3mino高等真核生物迅速生长的细胞中mRNA的半衰期平均约为3h.在高度分化的终端细胞中许多mRNA极其稳定,有的寿命长达几天或十几天,加上强启动子的转录,使一些终端细胞特有的蛋白质合成达到惊人的水平。例如,家蚕丝心蛋白基因具有很强的启动子,几天内即可转录出IO,个丝心蛋白mRNA,而它的寿命长达4天,每个mRNA分子能重复翻译出10’个丝心蛋白,所以4天内可产生10'°个丝心蛋白,说明mRNA寿命的延长是mRNA有效性的一个重要因素。7.3.2翻译水平的调控在蛋白质生物合成的起始反应中主要涉及到细胞中的4种装置,这就是:①核糖体,它是蛋白质生物合成的场所;②蛋白质合成的模板mRNA,它是传递基因信息的媒介;③可溶性蛋白因子,这是蛋白质生物合成起始物形成所必需的因子;④tRNA,它是氨基酸的携带者。只有这些装置和谐统一才能完成蛋白质的生物合成。我们已在前几章讨论了上述各点,这里仅就mRNA在蛋臼质合成11的调控功能作些探讨。1、真核生物mRNA的"扫描模式"与蛋白质合成的起始大量实验证明,在真核生物起始蛋白质合成时,40S核糖体亚基及有关合成起始因子首先与mRNA模板靠近5'末端处结合,然后向3'方向滑行,发现AUG起始密码子时,与60S大亚基结合形成80S起始复合物。这就是Kozak提出的真核生物蛋白质合成起始的"扫描模式。那么,为什么核糖体滑行到mRNA的第一个AUG,即在离5'末端最近的起始密码位点就
116停下来并起始翻译呢?现在认为,这是由AUG的前(5‘方向)和后(3'方向)序列所决定的。调查了200多种真核生物mRNA中5'末端第一个AUG前后序列发现,除少数例外,绝大部分都是A/GNNAUGG,说明这样的序列对翻译起始来说是最为合适的。所以,"扫描模式"相当合理地说明了许多真核生物mRNA的单一顺反子性质,也合理地解释了为什么将mRNA水解之后,它内部的起始密码会被活化。因为mRNA的水解产生出了新的5,末端,所以它又可以成为40S起始复合物的进入位点。那么,真核生物中具有相关生物功能的基因通过什么样的补偿机制得以协同表达呢?有人提出,真核生物通过"融合基因”的方式产生出多聚顺反子的替代物,即“多聚蛋白质”。多聚蛋白质是由相当长的mRNA编码的,如色氨酸合成酶,它的a亚基(相对分子质量28727)和亚基(相对分子质量42756)在大肠杆菌中分别由不同基因编码,但是,在真核生物酵母中,这两个多肽融合形成相时分子质量为76000的双功能蛋白质。红色链抱霉的arom基因簇也编码多功能蛋白,参与多聚芳香化合物的生物合成。此外,酵母的his4基因编码了一个三功能蛋白质。从功能上说,哺乳动物的脂肪酸合成酶(相对分子质量2.4X10)相当于大肠杆菌中一组7个之多的功能各不相同的多肽。所以,基因融合可能补偿了真核生物核糖体不能利用多聚顺反子型mRNA来协调各种不同蛋白质生物合成的缺陷。2、mRNA5'末端帽子结构的识别与蛋白质合成因为绝大多数真核生物mRNA5'末端都带有“帽子”结构,所以,核糖体起始蛋白质的合成,首先面临的问题是如何识别这顶"帽子"。真核生物mRNA5'末端可有3种不同的帽子,即0型、1型和2型,其主要差异在于帽子中碱基甲基化程度的不同。表7-15列举了这3种不同类型帽子的结构。*7-15真核生物mRNA的帽子结构种类结构mRNA0型M7GpppA/GpNp-酵母、粘菌1型m7GpppA^GmpNp-海胆胚、卤虫2型m'GpppN|.N"哺乳动物M'GpppNgN、哺乳动物真核生物的加帽子反应发生在mRNA前体刚转录出来不久或尚未转录完成时,催化这一过程的是鸟甘酸转移酶和甲基转移酶,它们部位于细胞核内。据认为,细胞中的帽子化酶是同时具有RNA三磷酸酶酯和鸟酸甘转移酶活性的多功能酶。通过鸟甘酸转移酶生成的是51-5'磷酸二酯键。从0型到1型帽子的生成都在细胞核内进行,由1型帽子进一步加工成2型帽子在细胞质内进行。3、mRNA的稳定性与基因表达调控在高等真核生物中转运铁蛋白受体(TfR)和铁蛋白负责铁吸收和铁解毒。这两个mRNA上存在相似的顺式作用元件,称为铁应答元件(ironresponsiveelement,IRE),IRE与IRE结合蛋白(IREBP)相互作用控制了这两个mRNA的翻译效率。当细胞处于缺铁或高铁水平时,能产生两个数量级的蛋白水平差异,却没有在mRNA水平上发现存在显著差异。研究表明,位于5'非翻译区的IRE控制了铁蛋白mRNA的翻译效率,去掉这个非翻译区IRE,可造成铁蛋白的永久性高水平翻译。当细胞缺铁时,IREBP与IRE具有高亲和力,两者的结合有效地
117阻止了铁蛋白mRNA的翻译。与此同时,TfRmRNA上3'非翻译区中的IRE也与IREBP特异结合,有效地阻止TfRmRNA的降解,促进TfR蛋白的合成(图7-47)。快圣白mRNAIRE5r偏示<—A”无IRE-BP,mRNA・利M!许与1RE-BP晶台,无mRNA起始M型3eiRE-BP.mRNA降解与IRE-BP结合,mRNA不降Xuuuuggacggaaccc0^CAAcuu0ccUUGGGAcuu-GuCOKC人铁蛋a-ire©FeFe-♦EcuuccAuAAuuAAUOAAOOUAUUAAUUA人铁蛋臼及冷运铁At白受体mRNA的副峰调控机,制此外,催乳素能明显延缓酪蛋白(casein)mRNA的降解。不加入催乳素时,体系中的酪蛋白mRNA在1小时内降解50%,而加入催乳素后40小时,酪蛋白mRNA才降解50%。4、可溶性蛋白因子的修饰与翻译起始调控许多可溶性蛋白因子(起始因子),对蛋白质合成的起始有着甫要的作用,对这些因子的修饰会影响翻译起始。例如:elF-2磷酸化对翻译起始的影响用兔网织红细胞粗提液研究蛋白质合成时发现,如果不向这一体系中添加氯高铁血红素,几分钟之内蛋白质合成活性急剧下降,直到完全消失。这是由于没有氯高铁血红素存在时,网织红细胞粗提液中的蛋臼质合成抑制剂会被活化,从而抑制蛋白质合成。抑制剂(HCI)受氯高铁血红素调节,它是eIF-2的激酶,可以使eIF-2的a亚基磷酸化,并由活性型变成非活性型。没有生物活性的HCI也可以通过自身的磷酸化变成活性型,这个过程可能是自我催化的,并与一个被HS因子的热稳定蛋白有关。氯高铁血红素能够阻断HCI的活化过程(图7-49)。eIF-2的a亚基磷酸化以后,elF-2与eIF-2B紧密结合,直接影响了eIF-2的再利用,从而影响了蛋白质合成起始复合物的生成。在蛋白质生物合成的过程中,特别是在起始反应中,mRNA的"可翻译性”是起决定作用的,其5'末端的帽子结构、二级结构、与rRNA的互补性以及起始密码附近的核甘酸序列都是蛋白质生物合成的信号系统。蛋白质生物合成的调控,就是通过mRNA本身所固有的信号与可溶性蛋白因子或者与核糖体之间的相互作用而实现的。思考题:真核生物和原核生物表达调控的主要异同点。第八章基因组与比较基因组学1.人类基因组计划2.DNA的鸟枪法序列分析技术
1181.比较基因组学和功能基因组学的研究什么是基因组?基因组学这一名词是美国人T・H-Rodehck在1986年7月造出来的,与一个新的杂志一genomics一道问世。基因组学完全改变只能研究单个基因的状况,它着眼于研究并解析生物体整个基因组的所有遗传信息。基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和(细胞内细胞器的DNA属于该细胞器的基因组)。1、原核生物基因组:原核生物DNA分布在整个细胞之中,有时相对集中在类核体上。类核体上的DNA是一条共价、闭合双链分子,类核体通常也称为染色体。原核生物中一般只有一条染色体。原核细胞都是单倍的。这条染色体的DNA就是原核细胞的基因组。2、真核生物基因组:一个物种的单倍体的各条染色体中的全部DNA为该物种的基因组(genome).例如,人有23对染色体,配子单倍体是23条染色体,这23条染色体中的全部DNA就是人体基因组。真核生物基因组的主要成分被核膜所包裹,与细胞质分开。人类基因组计划2003年4月14日,国际人类基因组宣布:人类基因组序列图--“完成图”提前绘制成功。人类基因组包括24条染色体,约30亿对核昔酸,编码5万〜6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死的全部遗传信息.从整体上看,不同人类个体的基因是相同的,“人类只有一个基因组”。不同的人可能拥有不同的等位基因,这一点决定了人们个体上的差异。与人类登月计划相比,HGP的资金投入少,但它对人类生活的影响都可能更深远。随着这个计划的完成,DNA分子中储藏约有关人类生存和繁衍的全部遗传信息将被破译,它将帮助我们理解人类如何作为健康人发挥正常生理功能,还将最终揭示严重危害人类健康疾病的机理。物理图思考题:1、在长为30亿对bp的人类基因组测序过程中怎样入手?2、测序是几百到几千对bp一段一段进行的,没有一定的标记是否会产生混乱?物理图可以从带有标签的一段一段的DNA连接成为大段的DNA,最终可以完成整个序列图。人类基因组的物理图是指以已知核昔酸序列的DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对(bp,kb,Mb)作为基本测量单位(图距)的基因组图。STS是基因组中任何单拷贝的长度在100〜500bp之间的DNA序列,与核酸内切酶识别序列相关联。得到5套以上包含相关染色体或整个基因组的DNA片段是建立STS物理图的先决条件。然后,可以通过拼接而得STS物理图。•两个STS标签在基因组上靠得近,它们就会一直同时出现在DNA大片段上;两个STS标签在基因组上相距较远,它们同时出现在一个DNA大片段上的几率就会小得多。•物理图的主要内容是建立相互重叠连接的“相连DNA片段群“•只要有一定数量的STS标签,所有DNA大片段在该染色体或基因组中的位置都能被确定。一刈距离很近\一对距离很远的STS标签\的STS标签A\/\H>11染色体物理图漕
119成套的DNA大片段两个标签同时出现在只仃两个DNA大片段6个DNA人片段中上有两个标签序列图10-9用STS标格技术制H展因组的物理图遗传图•遗传图(连锁图)一DNA标志在染色体上的相对位置(遗传距离),遗传距离以DNA片段在染色体交换过程中的分离频率厘摩(cM)来表示。cM值越大,两者之间距离越远。•通过遗传图分析,可以了解各个基因或DNA片段之间的相对距离。•连锁分析是通过分析同一遗传位点在不同个体中等位基因的不同(多态性)来研究同一染色体上两个位点之间的相互关系。•在产生配子的减数分裂过程中,亲代同“号”的父源或母源染色体既能相互配对也可能发生片段互换。•父母源染色体等位基因互换导致子代出现DNA“重组”的频率与这两个位点之间的距离呈正相关。用两个位点之间的交换或重组频率来表示其,崛传学距离”,即交换频率越高遗传学距离越远。•交换频率不会大于50%,因为当重组率等于50%(即遗传学距离等于50cM)时,即发生随机交换,则两个位点之间完全不连锁。
120茶因JK组频率w«与。之间:3.0%加与尸之间;33.7%,与h(之间:29.4%w与y之间:1.3%推集的遗传距离ywVm01.330.733.7图10-2遗传距离图的基本数据来自基因的重组上述4个基因都位于果蝇的X染色体上DNA遗传标记•1、RFLP(restrictionfragmentlengthpolymorphism9限制性片段长度多态性)。•DNA序列上的微小变化,可能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。多态性限制性位点DNADNA(等位基因2)加入限制性内切薛3个片段4个片段图10-3限制性片段长度多态性(RFLP)原理示意图
1211.弓0位点实文一1400”W12.弓IMJ品A位点女玄一之400bp1SO”W4N44DZAtarget性110—7人类组中的SZP作为遗传标ig的介子机刎(a)SgH*安心住的尸生S(b)5NT»敏一生昵L>ZAFT歹余文的5M座2.偿人欠交400bp150bp—,,◎”4轶央次支500t>p166bp400bp—:弓2W:K生W(wildtype)M:夹(mu«2、对分散于基因组中的单个碱基的差异进行标记。这种差异包括单个碱基的缺失和插入,但更常见的是单个核甘酸的替换,只p单核甘酸的多态性(singleenucleotidepolymorphism,SNP)»•由于该标记中的所有“遗传多态性”都来自单个核甘酸的差异,SNP有可能在密度上达到人类基因组“多态”位点数目的极限。•如果每一千个碱基(估计400bp有一个SNP位点)中有一个多态性,那么,人类基因组中就会拥有300万个SNP位点!•由于遗传中的选择压力,也由于基因组中蛋白质编码的序列仅占10%以下,绝大多数SNP位于非编码区。•SNP不再以DNA片段的长度变化作为检测手段,而直接以序列变异作为标记。nt>田10-4HKl中分乎标iC中的显性与共0步毋核分子机1M闺中体1阱类型星m木见的皿性*&住标记•隼2.3.4类郊型扶显性标记转录图•生物的性状,包括疾病,都是由功能蛋白质决定的,而所有已知蛋白质都是由RNA聚合酶n指导的带有多聚腺甘酸“尾巴”的mRNA按照遗传密码三联子的规律产生的。•分离纯化mRNA(或cDNA),抓住了基因组的主要成分(可转录部分)。,人类的基因转录图(cDNA图),即表达序列标签图(EST,expressedsequencetag)是人类基因组图的雏型。•整个人类基因组中,有1%-5%的序列编码了蛋白质,最多可能有(5〜7)万个蛋白质编码基因。•得到了一段cDNA或一个EST,就能被用于筛选全长的转录本,并将该基因准确地定位于基因组上。•大规模生产EST的程序:分离特定组织在某一发展阶段的总mRNA,合成cDNA
122并进行序列分析。•cDNA序列具有转录本的特异性,代表了不同基因的信息。可以将DNA序列和cDNA序列进行比对,找出对应于cDNA的基因。•收集各种细胞或组织的基因表达谱进行两两或多重比较,能较全面地了解哪些基因是特异性表达的。在某一细胞或组织中特异性表达的基因可能与该组织或细胞类型的生理功能有关。•获得各类组织或细胞的基因表达谱,从而给出人体200余种基本组织或不同细胞组成的人体基因图(bodymap)。•转录图(基因表达谱)研究所提供的信息,使人们有可能系统地全面地从mRNA水平了解特定细胞、组织或器官的基因表达模式并解释其生理属性,深入认识细胞生长、发育、分化、衰老和疾病发生的机制。人类基因组的序列图,人类基因组的核昔酸序列图(humangenomesequence)是分子水平上最高层次的、最详尽的物理图。测定总长约hn、由30亿个核甘酸组成的全序列。•人类所拥有的基因位点都是相同的,不同种族、不同个体的基因差异(人类基因组的多样性)以及“正常”与“疾病”基因的差异,只是同一位点上的等位基因的差异。•人类基因组与其他动物基因组在染色体水平上有“共线”(即同源)现象。人类第21号染色体HSA21位点与小鼠第16号染色体MMU16,MMU17和MMU10连锁图的比较,两者之间存在着广泛的同源性。•人类基因组计划所提供的人类核酸序列图,蕴藏了决定我们生、老、病、死的所有遗传信息,将成为人类认识自我、改造自我一使人类健康长寿的知识源泉,为21世纪现代生物学和医学奠定了基础。DNA的鸟枪法序列分析技术•1基因组DNA大片段文库的构建•构建基因文库是测序前必须的预备工作。用细菌的F质粒及其调控基因构建了细菌染色体克隆载体一BAC(bacterialchromosome),其克隆能力在125-150kb左右。以BAC为基础的克隆载体转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化。•2鸟枪法基因组序列分析技术•DNA序列分析技术一次测序反应的长度不能超过Ikb,不能直接用BAC等大片段作为序列分析的模板,采用全基因组鸟枪法测序技术一随机挑选插入基因组
123DNA的质粒做测序反应,然后用计算机程序进行序列拼接。DNA序列...GCAGCCAATGCIJ序列重比较基因组学及功能基因组学研究■与数据库中已知序列比较,基因组的序列可分为3类:1、确知其生理功能的;2、有相匹配的蛋白质序列,但并不知道其功能的;3、找不到任何相匹配的蛋白质序列的新基因。,比较基因组学(comparativegenomics)的威力根据对一种生物相关基因的认识来理解、诠释和克隆分离另一种生物的基因。1通过基因组数据进行全局性分析•到2001年为止已经基本完成DNA序列分析的各种真核生物基因组数据的比较发现,低等真核生物如酵母、线虫以及高等植物拟南芥,基因组比较小,基因密度比较高,百万碱基对中含有200个或更多的基因。50kb片段比较•(a)人B-T细胞受体位点只有一个基因(编码胰蛋白酶原)和52个重复序列,功能基因的序列占总序列不到3%。(b)在酵母第IV号染色体中有26个编码基因,2个tRNA基因,5个重复序列,功能基因序列占总序列的664%,重复序列占13・5%(在所有16条酵母染色体中,重复序列只有34%,有239个内含子)。该序列不带内含子。(c)在大肠杆菌基因组中可能有43个基因(占全序列的85・9%)。许多基因之间没有空间。原核生物一基因中没有内含子、基因组中没有重复序列。在整个大肠杆菌4639kb序列中共发现4397个编码基因。大肠杆菌K-12基因组和基因及其编码的蛋白质已经研究得比较清楚。参阅(表10-5).•人类基因组研究还发现,人类基因的平均长度为27kb左右,含有8・8个长约145bp的外显子,内含子的长度大大超过外显子,达到3365bp左右。人类基因的3,非翻译区(UTR)的平均长度为770bp,其5,非翻译区的平均长度为300bp,开放读码框的平均长度只有1340bp,编码447个氨基酸。2通过基因组数据进行比较基因组学研究•尿殖道支原体是最小的基因组(0-58Mb),可依此确定能自我复制的细胞必区
124需的一套最少的核心基因。流感嗜血杆菌的基因组为1.83Mb0流感嗜血杆菌基因大小平均900bp,尿殖道文原体的基因为1040bp。流感嗜血杆菌中平均1042bp有1个基因,尿殖道支原体中平均1235bp有1个基因。二者的差别在于基因数量上,流感嗜血杆菌有1743个ORF,尿殖道支原体有470个ORF。•通过流感嗜血杆菌能量代谢类群的ORF分析,了解到它缺乏三竣酸循环(TCA)中必需的3个酶,即柠檬酸合成酶基因、异柠檬酸脱氢酶基因和顺乌头酸酶基因。由此推断流感嗜血杆菌TCA缺失,不能合成谷氨酸,因为谷氨酸的供体是TCA的中间产生物a-酮戊二酸。3功能基因组学研究•功能基因组学一在基因组水平上阐明DNA序列的功能。许多基因和基因组的功能元件只有整个DNA序列已知才能得以发现。可用序列分析和比较的方式来判断不同基因的功能,也可通过各种定点破坏结构基因(geneknock-out)或在基因组内定位表达目的基因(geneknock-in)的方法来研究新基因的功能。•全长cDNA克隆对基因的发现及功能分析有用。APGSP21-在反转录醐作用下,用已如基因片段内部特异性引物GSPKpne-specificprimerI)启始cDNA第一条链的合成1用RN故混合物鞠膜板mHNA并纯化已合成机DNA第一条链3.由末端转移馨在已合成的cDNA链3沫端连续加入dOT,形成。降(觇)尾巴4.以连有函(杷)的锚定引物AP(anchorprimer)和基因片段内部特异引物GSP2(g«ie-specificprimer2)进行nestPCR才增,以期得到目的基因5'端片段并骸
1251.在反转耦的作肺,以连有可购mRNA3'多聚脑酸甄对的胸>(打)蹦定引物AP(anchorprimer)启始cDNA第一冬徒的合成2,用汕人鞠嘛mH"3.用豌曲AP德因片鼬部将照圈GSP("-整如prim)进行PCRF就以期得到目的哪3碌片配瓶行树I图1天麻营养茎(左)楸生茎(右)双向电泳银染图部•蛋白质组学是功能基因组学的一个重要的方面,蛋白质组学是研究某一生物体的器官或组织在某一时期全部蛋白质。双向电泳是基本的研究手段。
126•除了编码蛋白质结构的DNA序列外,还有大量的DNA序列行使了其他功能,如控制基因表达、RNA剪接、染色质结构域形成、染色体结构的维持、重组和复制等,要重视非蛋白质编码序列的研究,包括相关文库的生产、比较测序和计算机分析等。应支持开发新的实验和计算方法来研究蛋白质表达、蛋白质-配基反应及蛋白质修饰的整体空间和时间模式,不断为功能基因组学提供新的实验模式。
此文档下载收益归作者所有