欢迎来到天天文库
浏览记录
ID:33615335
大小:4.02 MB
页数:33页
时间:2019-02-27
《基于z曲线理论的转录因子结合位点的识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东北师范大学硕士学位论文析以及其他各种基因组学研究。随着人类基因组计划的完成,以及新基因的发现,系统了解基因组内所有基因的生物功能成为后基因组时代的研究重点,生物信息学进入了功能基因组时代,其发展方向【14】主要有以下几方面。1.各种生物基因组测试及新基因的发现人类基因组和许多模式生物的基因组测序已经完成,接下来的首要工作是对更多生物基因组的测序,获得更多物种的全部基因。从基因组序列中发现新基因也是生物信息学研究的热点之一。对于从人类基因组这类复杂的基因组中发现新基因,可以利用表达序列标签(EXpr懿sedSeq啪cc1’ag,EST)和比较基因组学方法进行研究。通过
2、比较基因组学的多种分析方法,可以从与已知基因和蛋白质的序列同源性得到证据,区分出基因组上的编码蛋白质区域和非编码蛋白质区域,从而确定新基因的编码区。2.单核苷酸多态性(SNP)分析单核苷酸多态性(sin百eNllCleotidePolymorpllism,SNP),是指在给定的一个群体中,超过1%的个体在给定的遗传区域内发生一次核苷酸改变。在群体的颁中,基因的多态性使得生物表现型表现出对外界物质的反应各不相同,这些便是基因SNP造成的结果。SNP被认为是一个物种中不同个体表型差异的主要遗传来源,是研究序列变化与可遗传的表型变化的有力工具,在基因与疾病方面大有可为,已经
3、成为生物信息学研究的热点之一。3.基因组非编码区信息结构与分析对于生物完整基因组,原核生物与真核生物的非编码区域占整个基因组的比例大不相同。微生物中的原核生物所含非编码区或内含非常少,人类基因组测序完成后的研究表明,真正编码蛋白质的区域只占5%左右,95%的区域是非编码区,从生物进化的角度看,这样庞大复杂的非编码区必然包含着与生物进化有关的信息。因此生物体的复杂结构和功能不仅仅是由基因决定的,也不仅仅是由基因组中大量的非编码区信息决定的,而是由这些元素在生物体各个层次上复杂、动态的相互作用决定的。4.比较基因组学和生物进化研究比较基因组学是在基因组水平对各种生物进行比
4、较,发现蛋白质功能,揭示生命起源和进化,它是通过比较人类基因组与其他模式生物基因组,从而为了解人类基因组结构、发现新基因和功能提供依据。生物进化是比较基因组学的重要研究方向之一,通过比较基因组学构建系统进化树可以对生命的起源、生物的进化等若干重大生物学问题进行分析研究。正是全基因组的比较研究使得生物信息学的研究实现片面向全面的突破。5.蛋白质结构和功能的研究蛋白质空间结构预测已成为生物信息学研究的焦点之一,所谓蛋白质空间结构预测是指从蛋白质的氨基酸序列预测出其三维空间结构,蛋白质结构预测对于理解蛋白质结构和功能关系,加强蛋白质工程研究及基于结构的药物分子设计具有十分重
5、要的意义。人类进入了信息时代,正经历着一场深刻的革命,信息时代带来了挑战,更带来了机遇,生物信息学作为多学科交叉的新兴学科,受到了世界各国的重视,我国虽然起步较晚,但对生物信息学的研究和应用十分重视,国内生物医学研究与开发对生物信息学5东北师范大学硕士学位论文的需求市场非常广阔,然而真正开展生物信息学研究和服务的机构或公司却相对较少,与发达国家相比,在人力和财力投入上明显不足,同时也急需要生物信息学人才的培养。特别是要跨学科地培养生物学和信息科学的复合型人才,我国已经开始较大规模地培养生物信息学专业人才,这为我国今后生物信息学的发展奠定了良好的基础。目前我国基因组和蛋
6、白质组研究在国际上已经占据了重要的地位,在生物信息学研究和应用在一些领域取得了一定的成绩,有的在国际上还占有一席之地,相信经过科学家们的努力和多学科专家的合作,完全有可能赶上甚至超过世界先进水平。1.4论文主要工作和框架本文的主要工作是提出了基于Z曲线理论的坐标矩阵模型ZCCM来描述转录因子结合位点的特征信息,提出了用于判定序列曲线与模型之间相似性的距离向量,在此基础上提出了新的识别转录因子结合位点的方法,以相似性距离向量为特征进行BP训练和分类,识别大肠杆菌的CRP、Fis、mF和撇四类转录因子的结合位点,对实验结果进行了全面的分析,比较四类转录因子的实验结果,并与
7、MethlspeCtor方法进行比较,结果表明本文提出的模型及识别方法都有较好的优越性。本文的主要框架:第1章:介绍生物信息学的发展历程、研究内容及发展方向;第2章:介绍转录因子结合位点的研究现状和研究意义、基本描述模型、常用方法、数据库等;第3章:3.1节介绍Z曲线理论及在各个领域的应用情况;3.2和3.3节提出了基于zCurve理论的坐标矩阵模型,定义建模公式、建模依据、方法和模型含义;3.4节将本文提出的模型与位置权重矩阵模型进行了全面的比较,3.5节提出信号强度,以反映单个位置的特异性;3.6节、3.7节、3.8节给出相似性距离向量,用以判定
此文档下载收益归作者所有