资源描述:
《基因、基因组及基因组学》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
基因、基因组及基因组学
1基因、基因组及基因组学基因:是指遗传物质(主要是DNA)分子上最基本的功能单位。编码的终产物可以是蛋白质也可以是RNA。基因组:一般是指某一物种单倍体细胞内的全套染色体DNA。基因组可分为原核生物基因组、真核生物基因组和细胞器基因组。基因组学:研究基因组结构与功能的学科。
2假基因来源于功能基因但已失去活性的DNA序列产生假基因的原因有:由重复产生的假基因;加工的假基因,由RNA反转录为cDNA后再整合到基因组中;残缺的基因。
3重叠基因:同一段DNA能携带两种不同蛋白的信息.重迭基因有以下几种情况:*一个基因完全在另一个基因内部*部分重叠*两个基因共用少数碱基对
4各式各样的“组”与“组学”名称定义相关学科基因组一种生物含有的所有DNA序列,包括基因和非基因序列基因组学蛋白质组一种细胞、组织或完整生物体所拥有的全套蛋白质蛋白质组学转录组一个活细胞所能转录出来的所有mRNA转录组学代谢组一种生物样品内所有的小分子代谢物代谢组学脂质组一个细胞、一个组织或一个生物体内所有的脂类物质脂质组学互作组一个细胞内由蛋白质之间、蛋白质与其他分子之间的相互作用而形成的网络互作组学
5
6基因组学遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征。研究对象以整个基因组为研究单位,而不以单个基因为单位作为研究对象。研究目标认识基因组的结构、功能和进化;阐明整个基因组所包含的遗传信息和相互关系;充分利用有效资源,预防和治疗人类疾病。
7基因组学分类根据研究对象分:动物基因组学、植物基因组学、肿瘤基因组学、药物基因组学、环境基因组学等根据研究的重点分:结构基因组学、功能基因组学、比较基因组学
8基因组学主要涵盖以下几个方面:结构基因组学——着重遗传图、物理图、测序等研究;功能基因组学——包括以转录图为基础的功能制图(基因组表达图);蛋白质组学——鉴定蛋白质的产生过程、结构、功能和相互作用方式;比较基因组学——包括对不同进化阶段生物基因组的比较研究,也包括不同物种、族群和群体基因组的比较研究。基因组学
9结构基因组学概念和目的基因图谱结构基因组学研究常用方法
10结构基因组学基因定位基因组作图测定核苷酸序列
11结构基因组学的概念和目的以全基因组测序为目标的基因结构研究弄清基因组中全部基因的位置和结构,为基因功能的研究奠定基础。其目的是建立高分辨的基因图谱。
12基因图谱遗传图谱(连锁图谱)物理图谱序列图谱(分子水平的物理图谱)
13遗传图谱(连锁图谱)概念:指基因或分子标记在染色体上的相对位置与遗传距离,用厘摩(cM)表示。1cM的遗传距离表示在100个配子中有1个重组子。在哺乳动物中,遗传图谱上1cM的距离大约相当于物理图谱上1000000bp。通过该图谱可分清各基因或分子标记之间的相对距离与方向,如靠近着丝粒或端粒。该图谱的构建是以位于同一染色体相邻的2个基因或遗传标记的重组率为基因,因而需要有参考家系和分子遗传标记或基因作为研究基础。
14遗传图谱与遗传标记采用遗传分析的方法将基因或其他DNA序列标定在染色体上构建连锁图。有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻找基因组不同位置上的特征标记。包括:形态标记细胞学标记生化标记DNA分子标记
15多态性所有的标记都必须具有多态性!花色:白色、红色株高:高、矮血型:A、B、O型淀粉:糯、非糯所有多态性都是基因突变的结果!
16形态标记形态性状:株高、颜色、白化症等又称表型标记控制性状的其实是基因,所以形态标记实质上就是基因标记。数量少很多突变是致死的受环境、生育期等因素的影响
17伯乐相马按图索骥
18细胞学标记明确显示遗传多态性的染色体结构特征和数量特征:染色体的核型染色体的带型染色体的结构变异染色体的数目变异优点:不受环境影响缺点:数量少、费力、费时、对生物体的生长发育不利
19生化标记又称蛋白质标记就是利用蛋白质的多态性作为遗传标记。如同工酶优点:数量较多,受环境影响小缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息
20DNA分子标记简称分子标记,以DNA序列的多态性作为遗传标记随着分子生物学的发展,相继建立了RFLP、TRS、SNP等多种分子遗传标记检测技术,开创了遗传标记研究的新阶段。优点:不受时间和环境的限制遍布整个基因组,数量无限不影响性状表达自然存在的变异丰富,多态性好共显性,能鉴别纯合体和杂合体
21分子遗传标记RFLP(第一代):限制性片段长度多态性TRS(第二代):串联重复序列标记SNP(第三代):单核苷酸多态性
22RFLP的原理利用限制性内切酶消化基因组DNA,形成大小不等、数量不同的分子片段,酶切位点的改变,会使得RFLP谱带表现出不同程度的多态性.
23PCR-RFLP将PCR技术用于RFLP分析,即PCR-RFLP。该技术先用1对引物特异性扩增基因组的某一高变区,然后用限制性内切酶消化PCR产物,电泳检测多态性。
24PCR-RFLP的应用••••••CCTGAGGAG••••••••••••CCTGTGGAG••••••••••••CCTGAGGAG••••••••••••CCTGAGGAG••••••••••••CCTGTGGAG••••••••••••CCTGTGGAG••••••√MstⅡ酶切位点×MstⅡ酶切位点消失PCR-RFLPProValGluProGluGlu123正常 杂合 异常
25TRS真核生物基因组中的可变串联重复序列(variablenumbertandemrepeatedsequence,VNNTR)有两类:小卫星和微卫星,两者具有高度的变异性。
26小卫星DNA小卫星重复单位的核心序列为15~76bp近缘物种和个体间的小卫星核心序列有着一定的同源性,在一定的条件下可以相互杂交。
27DNA指纹图谱原理选择在VNTR特异序列上没有酶切位点的限制性内切酶将动物总基因组DNA切成不同长度的片段;以VNTR中特异序列作为探针,进行Southern杂交;由于不同个体的串联重复序列的数目和位置不同,形成的杂交谱带具有个体的特异性,人们称为DNA指纹图谱。
28VNTR示意图123A B C123VNTR变异的原理示意图
29
30微卫星DNA又称简单序列重复(simplesequencerepeat,SSR)是高度重复序列,广泛存在于真核生物基因组,重复单位的核心序列为2~6bp。
31微卫星遗传标记的原理以微卫星DNA标记两侧特异性序列设计专一引物,通过PCR技术扩增微卫星片段,扩增产物经变性聚丙烯酰胺凝胶电泳分离,不同个体间因核心序列的重复次数不同而产生DNA多态性。
32微卫星遗传标记示意图ABPCR扩增凝胶电泳123AAAB BB
33SNP是指染色体上的某个存在单个碱基的变化,包括单碱基的转换、颠换、插入及缺失等。
34遗传图谱的构建方法理论基础:连锁与交换基本方法:两点测验法和三点测验法
35物理图谱遗传图所表现的是通过连锁分析确定的各基因间的相对位置;物理图则表现染色体上每个DNA片段的实际顺序,是指以已知核苷酸序列的DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对(bp,kb,Mb)作为基本测量单位(图距)的基因组图。用于确定各遗传标记间的物理距离有两种物理图谱:(1)以已定位的DNA序列标记位点(STS)为位标,以DNA实际长度为图谱距离的基因组图谱。(2)由YAC和/或细菌人工染色体(BAC)连续克隆重叠群组成的物理图谱。
36物理作图的方法1、限制酶作图2、依靠克隆的基因组作图3、荧光原位杂交4、序列标签位点作图
37荧光原位杂交(fluorescentinsituhybridization,FISH)
38序标位作图(STS,SequenceTaggedSite)长度:100-500bp序列已知,可以设计PCR反应单拷贝,在染色体上的位置是唯一的EST(Expressedsequencetag))大部分可以作STS
39STS作图原理
40寻找STS的方法表达顺序标签(expressedsequencetag,EST)从cDNA中找到的小段顺序,但基因家族成员间共有的序列不能用于STS。随机基因组顺序
41ESTEST是一个cDNA克隆快速大规模测序后所获得的3′-端和5′-端部分cDNA随机片段,每个EST长度约200~600bp,代表了一个单拷贝基因的部分cDNA表达序列。由于大多数EST的长度不足400bp,说明一个基因转录本的cDNA序列可能包含多个序列重叠的EST,由于一个基因mRNA剪接点不同可以获得多个cDNA克隆,因此EST既可能对应于一个cDNA的某一部分,又可能代表mRNA的不同剪接方式 。
42遗传图与物理图的整合有些标记既是遗传标记,又是物理标记,如RFLP标记、SSR标记和某些基因序列借助这些标记可以将遗传图和物理图整合起来
43序列图谱(分子水平的物理图谱)以某一染色体上所含的全部碱基顺序绘制的图谱。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
44基因组测序策略有了高密度的基因组图谱,就可以开始全基因组测序了测序的技术飞速发展,现在可以全自动化测序的策略有两个:鸟枪法克隆重叠群法
45鸟枪法
46采集5个自愿者的DNA样品构建3种不同插入子大小的基因组文库2Kb,10Kb和50Kb完成约2700万次插入子末端测序,总长14800MbGeneBank下载104018个BAC末端顺序PFP发表的公开数据主要为BAC克隆的顺序,共4443.3Mb随机测序与序列组装方法和指导测序与序列组装方法相结合进行序列组装
47国际人类基因组测序策略构建BAC克隆↓限制性酶处理获得指纹↓根据指纹重叠方法组建BAC克隆重叠群↓根据STS标记,将BAC克隆重叠群标定在物理图上↓每个BAC克隆内部采用鸟枪法测序,组装↓将BAC插入顺序与BAC克隆指纹极重叠群对比,将已阅读的顺序锚定到物理图上
48克隆重叠群法(clonecontig)将基因组DNA切割长度为0.1Mb-1Mb的大片段,克隆到YAC或BAC载体上然后再进行亚克隆,分别测定单个亚克隆的序列再装配、连接成连续的DNA分子。这是一种自上而下的测序策略clone-by-clonemethod
49功能基因组学又称后基因组学基因的识别、鉴定、克隆(转录图谱)基因结构、功能及其相互关系基因表达调控的研究
50功能基因组学研究策略及主要内容
51转录图谱(表达图谱)以EST为位标,根据转录顺序的位置和距离绘制的图谱,它是染色体DNA某一区域内所有可转录序列的分布图,是基因图的雏形。方法:用已在染色体定位的YACDNA或BACDNA为探针,与所有可能相关的各组织cDNA文库杂交,寻找其同源克隆并做进一步分析。
52根据序列分析搜寻基因查找开放阅读框(openreadingframe,ORF)开放阅读框都有一个起始密码子,ATG,还要有终止密码子。从ATG开始,然后向下游寻找终止密码子。起始密码子和终止密码子之间的碱基数目要能够被3整除每一条链都有3种可能的阅读框,2条连共计有6种可能的阅读框.计算机可以很快给出结果。
53同源查询利用已经存入数据库的基因序列与待查的基因组序列比对,从中查找可以与之匹配的碱基序列及其比例,用于界定基因。同源查询可以部分弥补ORF扫描的不足。
54同源查询的依据有亲缘关系的物种,基因组可能存在某种程度的相似性:存在某些完全相同的序列;ORF的排列相似,如等长的外显子;ORF指令的氨基酸序列相似;模拟的多肽链的高级结构相似等。
55基因功能研究1、计算机预测基因功能依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多相似的序列。种间同源基因种内同源基因
56基因的类似物与同源物类似物(analog)——具有相同的功能,但起源于不同的祖先基因,它们是基因趋同进化的产物;同源物(homolog)——指存在于不同生物或者同种生物,来源于某一共同祖先基因的基因。它包含两类,一类是种间同源物(ortholog)和种类同源物(paralog)。(1)直向同源物或直系同源物——是指来自于不同物种的由垂直家系(物种形成)进化而来的基因,它们通常保留与原始基因相同的功能,但也不尽然。例如小鼠、蛙和鸡各自编码的α珠蛋白或β珠蛋白的基因;(2)种内同源物或旁系同源物——是指同一物种内由于基因复制、分离产生的同源物。它们可能会进化出新的但与原来功能有关的功能。例如,编码小鼠α珠蛋白和β珠蛋白,蛙的α珠蛋白和β珠蛋白,鸡的α珠蛋白和β珠蛋白的基因。
57
58基因功能研究2、实验确认基因功能定位克隆(positionalcloning)基因敲除(geneknockout)和敲减技术(geneknockout)蛋白质组学研究生物信息学研究等。
59蛋白质组学蛋白质组是指由基因组编码的全部蛋白质。蛋白质组学就是指研究细胞内所有蛋白质及其动态变化规律的科学。
60生物信息学生物信息学是以计算机为工具,用数理及信息科学的理论和方法研究生命现象,对生物信息进行储存、检索和分析的一门学科。
61基因组学的发展历程流感嗜血杆菌(haemophilusinfluenzae)1995年7月第一个细菌基因组全序列发表,大小为1.8Mb。含1703个基因。这是微生物乃至整个生物学领域的一个里程碑1997年9月,大肠杆菌的完整基因图谱已绘制成功,基因组全序列完成,全长为5Mb,共有4288个基因,同时也搞清了所有基因产物的氨基酸序列.啤酒酵母,1997年,第一个真核生物基因组图谱公布。
62秀丽线虫(caenorhabditiselegans):1998年12月完成了基因组测序。基因组大小100Mb,分布于6条染色体,预测有19099个基因。
63果蝇:Celera公司2000年3月宣布了基因组全序列为180Mb。有13601个基因,其中一半的基因功能还没有搞清楚,有1600个碱基跨度区仍未能完全测序。2000年12月,第一个植物基因组——拟南芥基因组被全部测序,遗传图谱、物理图谱建立,序列大小为125Mb。基因组测序区段覆盖了全基因组的115.4Mb,分析共含有25498个基因,编码蛋白来自11000个家族。
642001年2月中旬,Nature与Science分别发表了人类基因组工作框架图,报告人类基因组共有30亿个碱基对,预测编码基因31000个,比最初预测的十多万个编码基因数大大减少。2003年人类基因组计划宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现人类遗传变异图谱研究以及黑猩猩基因组测序计划开始
652004年3月1日,多国科学家组成的两个研究小组宣布绘制出鸡的基因序列草图和遗传差异图谱。科学家选取了家鸡的远祖——红原鸡为测绘对象,绘制出了草图中约10亿个碱基对,相当于人类的三分之一。科学家在9日出版的《Nature》杂志上载文说,分析发现,红原鸡约有2万到2.3万个遗传基因,与人类数量基本持平,其中有60%与人类相同。
662002年4月,水稻基因组图谱公布。
672002年小鼠、疟原虫和按蚊基因组测序完成小鼠基因组共有约27亿个碱基对,比人类少15%,但其包含的基因数目与对人类基因数的最新估计非常接近。
68另外,此前科学界一致认为鸡没有嗅觉,但是分析结果表明鸡具有大量的嗅觉基因,味觉基因却很缺乏。分析还发现,鸡缺乏人类所具有的产生乳汁、唾液和牙齿的基因。意外的发现