欢迎来到天天文库
浏览记录
ID:33906036
大小:3.48 MB
页数:126页
时间:2019-03-01
《基于系统发育分析的基因表达数据处理方法和基因水平转移检测软件》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、复旦大学博士学位论文y955伯8陟基于系统发育分析的基因表达数据处理方法和基因水平转移检测软件院系:生命科学学院专业:生物信息学姓名:李作峰指导教师:钟扬教授完成日期:2006年4月15日曼,摘要摘要系统发育分析方法是进化生物学研究中的重要方法论工具,也是目前生物信息学中数据分析的主要方法之一。本文将系统发育分析方法应用于基因芯片数据分析和基因组中水平转移基因检测,为解决这两个生物信息学问题开拓了新的思路。随着基因组学的发展,基因芯片技术已广泛用于在基因组水平上监控基因表达水平。一直以来,基因芯片的数据分析方法主要是聚类分析,其目的是降低数据维数,并在此基
2、础上进一步分析得到新的生物学知识。但是,这种策略本身没有可靠的分类指标和可靠的统计学或生物学背景,结论往往依赖于研究人员的主观判断。本文第一部分用系统发育的方法分析了丝氨酸蛋白酶抑制剂(serineproteaseinhibitor,serpin)基因的基因芯片表达数据。到目前为止,研究人员已经对serpin基因超家族各成员的生理学功能及其特征进行了较为详尽的研究,然而,人们对serpin基因的进化模式仍然不甚清楚。这个超家族的基因重复研究可能对解决这个问题提供一些启示。目前,有两个模型用来预测重复基因的保留(preservation):经典模型和重复一变
3、性一互补模型(duplication.degeration.complementationmodel,DDCmodel)。在本文中,我们利用诱导表达转录因子AML.ETO基因的U937细胞的时间系列基因芯片数据,检测了人类serpin基因家族多个成员的序列和表达分歧之间的关联。我们用人类serpin基因家族的蛋白质编码区重建了其系统发育关系,然后将基因表达数据标记在简化的系统发育树上,并检测了基因突变速率同基因表达样式之间的相关性。我们发现在serpin基因超家族的SERPINA和SERPINB家族的成员中,基因的同义突变速率同表达数据的时间分歧之间具有相
4、关性。然后,我们用这种相关性来检测了不同基因进化模型的有效性,发现serpin基因超家族的成员是按照DDC基因重复模型进化的。我们的研究提供了一个新的基因序列和芯片数据的比较分析方法。为了能够将这个工作扩展到基因组水平,本文设计并初步实现了PhyloExp软件包。本文第二部分将系统发育分析的方法应用于检测微生物基因组中的水平转移基因。上世纪50年代末科研人员发现基因水平转移现象以来,科研人员已经逐渐接受了这一概念。在这一部分中,我们首先详细介绍了两个免费的软件:微软Windows操作系统上运行的T-REX和Linux操作系统上运行的RHOM。T-REX,摘
5、要是一个图形界面程序,它利用基因和物种距离矩阵来重新构建供体和受体物种间的基因水平转移网络。RHOM是一组命令行驱动程序,用以根据基因组序列特征检测基因水平转移。T-REX图形界面和绘制网状结构图的功能给人留下了很深p的印象;而RHOM最为突出的就是其严谨的基因组统计学框架及其图像化显示候选水平转移基因序列位点概率估计值。这两个软件分别对应两种分析策略:一种称为替代算法,另一种称为系统基因组策略。然而,这两种方法都有其不可克服的局限性,一方面,替代算法不能给出基因的来源;另一方面,系统基因组学策略无法解决“孤儿”基因的问题。由此,我们设计了HAPLY软件,
6、它首先通过本地替代算法来检测基因组可能的水平转移基因,然后通过利用网络资源来实现单基因的系统发育基因组学策略,来确定其可能的来源,从而将两类算法有机的整合在一起。本文初步设计并实现了HAPLY软件,为进一步工作奠定了基础。·关键词:基因芯片DNA微阵列基因表达谱系统发育分析基因水平转移丝氨酸蛋白酶抑制剂系统基因组学II■●●AbstractPhylogeneticanalysisisoneofthemainmethologiesinbothevolutionarybiologyandbioinformatics.Inthisdissertation,phy
7、logeneticanalysisisappliedtoanalyzeDNAmicroarraydataanddetecthorizontalgenetransfer.Thisgivesoutanewstrategytosolvethesetwobioinformaticsproblems.Withthedevelopmentofgenomics,manygenome.scaleexperimentsforgeneexpressionprofilewereconductedbyDNAmicroarraytechniques.Foralongtime.clu
8、steringalgorithmsaremainapproache
此文档下载收益归作者所有