欢迎来到天天文库
浏览记录
ID:27127382
大小:5.52 MB
页数:74页
时间:2018-12-01
《基于数据融合的共调控基因挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于数据融合的共调控基因挖掘方法研究RESEARCHOFCOREGULATEDGENESMININGTECHNOLOGYBASEDONDATAFUSION史文丽哈尔滨工业大学2013年6月中图分类号:TP391.3学校代码:10213 国际图书分类号:681密级:公开工学硕士学位论文基于数据融合的共调控基因挖掘方法研究硕士研究生:史文丽导师:郭茂祖教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2013年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3 U.D.C:681DissertationfortheMa
2、sterDegreeinEngineeringRESEARCHOFCOREGULATEDGENESMININGTECHNOLOGYBASEDONDATAFUSIONCandidate:ShiWenliSupervisor:Prof.GuoMaozuAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2013Degree-Conferring-I
3、nstitution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要21世纪是生命科学和信息技术的世纪,共调控基因挖掘是生物学家在基因功能关联领域研究工作的核心之一。DNA微阵列芯片的发展使作为生物信息学数据源的表达水平数据已经能够通过生物学实验海量提取。利用这些数据分析调控因子如何对若干基因进行表达调控,可以构建基因调控网络,而构建基因调控网络是挖掘共调控基因的主要任务之一。共调控基因指的是一组基因的集合,这组基因在生物细胞中被相同调控因子进行调控,控制其在转录或翻译阶段的表达,进而影响细胞执行其相应功能。构建基因调控网络并挖掘其中的共调控基因
4、,可以从分子水平上理解生物体的生理活动和功能,了解生物体如何根据基因的不同表达而产生的变化。从表达水平数据中计算共表达团,得到转录调控模块是目前普遍使用的挖掘共调控基因的方法。然而大部分共调控基因不仅在表达水平上具有相似模式,而且在生命体的某一过程当中具有相似功能,所以同时利用表达水平数据与本体数据来挖掘共调控基因,能够更准确地分析和发现基因间的共调控关系。本文针对共调控基因的挖掘,分别从表达谱相似性、本体相似性与综合网络集中频繁稠密子图挖掘三个方面进行了研究:(1)通过对共调控基因在表达谱中的表达相关性进行研究,定义了一种基于子空间搜索的基因表达谱相似度计算方法。首先搜索基因的样本空间
5、,找出待搜索基因的相关空间,其次计算此相关子空间上基因表达水平的相似性,从而解决了共调控基因相似性计算中的正反共调控和部分时间共调控的发掘问题。(2)由于基因本体(GeneOntology,GO)能够更统一高效地注释基因产物,所以利用它提供的丰富信息来预测基因之间的功能关联。通过对基因本体结构进行分析研究,提出一种基于语义分化的基因本体语义相似性度量方法。本方法引入了语义分化因子与最短路径的概念,对每个术语所含有的信息量重新定义,使每个术语在GO图中拥有固定的信息量,并采用节点的子孙节点的个数比来定义边的语义分化因子。该方法融合了节点之间的信息量与路径双重语义,充分考虑了术语在GO拓扑结
6、构上的位置信息,更能够反应生物体之间的关系。(3)提出一种基于数据融合共调控网络的共调控基因挖掘方法。该方法首先对表达谱数据与本体数据的相似性度量结果进行筛选,得到一个“共调控网络集合”,然后利用图论中的频繁稠密点集挖掘方法,从中挖掘出所需的共调控基因组。结果表明,此方法所得出的共调控基因组被同一调控因子调控的比例远高于单独使用一种数据源进行挖掘的方法,具有很好的应用潜力。关键词:基因表达数据;基因本体;表达相似性;语义相似性;共调控基因I哈尔滨工业大学工学硕士学位论文Abstract21stcenturyisdominatedbybiotechnologyandisalsothecen
7、turyoflifescience andinformationtechnology.Miningco-regulatedgeneshasbecomethecoreareaof researchaboutgenefunctionassociation.NovelDNAmicroarraytechnologyhasbeen abletosimultaneouslymonitortheexpressionlevelsofthousand
此文档下载收益归作者所有