欢迎来到天天文库
浏览记录
ID:56277541
大小:28.00 KB
页数:2页
时间:2020-06-05
《生物信息学讲义.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、生物信息学讲义第一章:生物信息学概述什么是生物信息学:又称计算生物学(computationalbiology),是生物学与信息学、计算机科学相互交叉形成的新兴学科,它应用数学、计算机科学的方法研究生物学问题,它所研究的主要对象是生物学的数据。生物信息学是为了适应人类基因组计划(HumanGenomeProject,HGP)的需要产生的,最主要的应用是对人类基因组计划所得到的大量生物学数据进行存储、检索和分析。目前生物信息学已被广泛的应用于医学、人类学、结构生物学和蛋白质组学(Proteomics)等研究领域。生物信息学的研究内容:广义地说,生物信息学
2、从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。具体地说,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。生物信息学还利用基因组中编码区的信息进行蛋白质空间结构的模
3、拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。基因组信息学、蛋白质的结构计算与模拟以及药物设计,这三者紧密地围绕着遗传信息传递的中心法则,因而必然有机地连接在一起。1、 基因组序列数据的拼接和组装基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码有32亿个碱基,而目前DNA测序多采用鸟枪法(shotgun),每个反应只能读取几百到上千个碱基。在进行测序前,首先应用物理方法将人的基因组打碎,得到基因组片段进行测序,然后再把这些片段重新拼接起
4、来。基因组序列数据的拼接和组装是生物信息学研究的一个热点研究领域,美国华盛顿大学、加利福尼亚大学在该领域的研究居于绝对领先地位。2、 发现新基因和新的单核苷酸多态性1) 电脑克隆:利用EST数据库发现新基因也被称为基因的电脑克隆。EST序列是基因表达的短cDNA序列,它们携带着完整基因的某些片段的信息。到2001年10月,GenBank的EST数据库中人类EST序列已超过380万条,它大约覆盖了人类基因的90%以上。电脑克隆德的原理是找到属于同一基因的所有EST片段,再把它们连接起来。由于EST序列是全世界很多实验室随机产生的,所以属于同一基因的很
5、多EST序列间必然有大量重复小片段,利用这些小片段作为标志就可以把不同的EST连起来,直到发现了它们的全长,这样我们就可以说通过电脑克隆找到了一个基因。但是电脑克隆的产物需要经过实验的验证。2) 从基因组DNA序列中预测新基因:从基因组序列预测新基因,本质上是把基因组上编码蛋白质的区域和非编码蛋白质的区域区分开来。对于理论方法来讲就是要找到在编码区和非编码区哪些数学、物理学特征是不一样的。将这些序列与已知基因数据库进行比较,可以发现新基因。国际人类基因组协作组正着手建立完整的“整合基因索引”及与之相关的“整合蛋白索引”。3) 发现单核苷酸多态(Si
6、ngleNucleotidePolymorphism,SNP):SNP研究是人类基因组计划走向应用的重要步骤。这主要是因为SNP将提供一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。,研究表明SNP在人类基因组中分布相当广泛,大约每300碱基对就出现一次。大量存在的SNP位点,使人们有机会发现与各种疾病,包括肿瘤相关的基因组突变;从实验操作来看,通过SNP发现疾病相关基因突变要比通过家系来得容易;有些SNP并不直接导致疾病基因的表达,但由于它与某些疾病基因相邻,而成为重要的标记。SNP在基础研究中也发挥
7、了巨大的作用,近年来对Y染色体SNP的分析,使得在人类进化、人类种群的演化和迁徙领域取得了一系列重要成果。3、 基因组中非编码蛋白质在细菌这样的微生物中,非编码蛋白质的区域只占整个基因组序列的10%到20%。随着生物的进化,非编码区越来越多,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分。这些非编码序列必定具有重要的生物功能。目前的研究认为它们与基因的表达调控有关。对人类基因组来说,迄今为止人们真正掌握规律的只有DNA上的编码蛋白质的区域,最新资料说明这部分序列只占基因组的1.1%。非编码区占整个基因组的98%,寻找这些区域的编码特征、
8、信息调节与表达规律是未来相当长时间内的热点课题,是取得重要成果的源泉。4、 在基因组水平研究
此文档下载收益归作者所有