基于关联规则的基因芯片数据挖掘与应用

基于关联规则的基因芯片数据挖掘与应用

ID:33729909

大小:6.68 MB

页数:159页

时间:2019-02-28

基于关联规则的基因芯片数据挖掘与应用_第1页
基于关联规则的基因芯片数据挖掘与应用_第2页
基于关联规则的基因芯片数据挖掘与应用_第3页
基于关联规则的基因芯片数据挖掘与应用_第4页
基于关联规则的基因芯片数据挖掘与应用_第5页
资源描述:

《基于关联规则的基因芯片数据挖掘与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第三军医大学博士学位论文基于关联规则的基因芯片数据挖掘与应用姓名:彭斌申请学位级别:博士专业:流行病与卫生统计学指导教师:易东20080401第三军医大学博士学位论文基于关联规则的基因芯片数据挖掘与应用摘要人类基因组草图(HumanGenomeDraR,HGD)的绘制完成标志着现代生命科学研究从基因组时代进入了后基因组时代,研究的重心由结构基因组学转向功能基因组学,基因彼此之间的相互作用、相互影响越来越多地受到研究者的关注。基因芯片作为一种高通量的检测技术,可以同时检测成千上万条基因的表达水平,成为研究基因与基因之间相互作用关系的强大工具。随着基因芯片大量数据的

2、产生,数据挖掘成为从基因芯片表达数据中解读基因相关信息的重要技术手段。本研究针对目前关联规则挖掘技术用于基因芯片表达数据分析时存在的问题,从三个方面进行了比较全面和深入的研究:时序基因芯片表达数据的跨事务关联规则挖掘、传统关联规则中基因表达状态信息缺失问题及大量关联规则的聚类问题等。本文的主要内容及贡献包括:(1)时序基因芯片表达数据中的跨事务关联规则挖掘研究为了解决传统关联规则忽视数据中的时间信息以及无法对基因的表达状态进行动态预测的问题,本研究提出将跨事务关联规则挖掘技术引入到时序基因芯片表达数据的分析之中,并对跨事务关联规则进行了详细介绍。结合生物学数据库

3、,包括GeneOntology基因注释数据库、iHOP数据库、DAvID生物信息学资源数据库等,对挖掘出来的跨事务关联规则进行分析,结果显示跨事务关联规则能够有效地挖掘时序基因芯片表达数据中的隐含信息,产生的关联规则符合生物学背景,合理地描述基因之间的动态表达行为。因此,跨事务关联规则为基因功能的预测提供了新的手段和方法。(2)传统关联规则中基因表达状态信息缺失问题研究通过对传统关联规则中基因表达状态信息缺失这一问题的深入分析,本研究设计了一种新型的关联规则类型——差异表达关联规则(Di舵附1tialEXpressionAssociationRules,DEAR

4、),并给出了基本定义及相关概念。为了能够有效地挖掘差异表达关联规则,本文提出了一种算法——差异表达关联规则矩阵算法(Di艉rentialExpressionAssociationRulesⅡI第三军医大学博士学位论文Ma仃ixAlgoritllm,D雕LRM算法),并对进行了详细地阐述。实验结果表明,差异表达关联规则在发现基因表达模式及控制冗余规则产生方面要优于传统关联规则。差异表达关联规则作为一种新的关联规则类型,是对关联规则挖掘内容的丰富,将有助于研究人员从基因芯片表达数据中揭示基因之间隐含的表达关系。(3)大量关联规则的聚类研究关联规则挖掘通常会推导出大量

5、的规则,这给后期的分析与利用带来了巨大的障碍。本研究针对这一现实问题,提出了采用聚类分析对关联规则进行后期处理。为了更有效地对关联规则进行聚类,本文提出了新的关联规则相似性度量方法一内容结构加权度量,从关联规则的结构及内容上全面反映关联规则的相似性,克服了已有度量方法的缺陷只注重内容方面的缺陷。本文将聚类结果与生物学数据库GeneOntology相结合进行分析,从生物学的角度说明了同一个子类中的关联规则所涉及的基因有着相似或者相关的生物学基础,体现了聚类在关联规则后期分析处理中的价值。因此,聚类分析将为研究才从关联规则中发现感兴趣的模式提供重要的、可视化的技术手

6、段。关键词:关联规则、跨事务关联规则、差异表达关联规则、基因芯片、微阵列、基因表达数据、基因相互作用、聚类分析、相似性、数据挖掘、Apriori算法IV第三军医大学博士学位论文AssociationRulesMiningandItsApplicationsinMiCroarrayGeneExpreSSionDataAbstractThecompletionofhumangenomedraR(HGD)showsthatmodemlifescienceresearchhasenteredthepost-genomicera,theresearchfocushassh

7、iRedfbmstmcturalgenomicsto向nctionalgenomics,andsn.onginteresthasarisenregardingtheelucidationofinteractionsbetweengenes.TheDNAmicroarray,ahigh-throughputmethod,isabletoroutinelymeasuretheexpressionleVelsofhundredsofthousandsofgenessimultaneously,soit’sapower如ltooltoEndtherelationsamo

8、nggenes.Duet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。