欢迎来到天天文库
浏览记录
ID:32032713
大小:3.83 MB
页数:109页
时间:2019-01-30
《【硕士论文】基于DNA微阵列基因表达谱数据的癌症检测研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、博I学伊沧文摘要癌症治疗面临的重大挑战是如何针对病原上各自独特的癌症类型制定具体的治疗方法,以达到最大疗效的同时降低药物的副作用。因此,癌症检测或癌症分类成为癌症治疗的中心环节。一直以来,癌症检测主要基于肿瘤的形态表观,但这种检测方式有很大的局限性,因为具有相似组织病理学表观的肿瘤可能表现出很不相同的临床发展过程,或者对同种治疗呈现出不同反应。近年来,DNA微阵列技术的发展产生了海量的基因表达谱数据,为寻找基因之间表达调控的复杂关系网络,研究功能基因组和癌症检测提供依据。目前,利用基因表达谱进行癌症检测成为癌症研究的重点之一。但是基因表达谱数据具有高维性,高噪声,高冗余,数据
2、分布不均衡等特点,对基因数据分析方法提出了更高要求,对基于DNA微阵列基因表达谱的癌症检测带来了挑战。本论文从基因表达谱数据的分析着手,以挖掘基因表达模式和癌症检测研究为主要目标,研究癌症检测中基因表达数据的预处理、特征基因的选取、癌症组基因表达模式的分析以及建立合适的基因诊断模型的问题。本文的主要工作归纳如下:第一,针对基因表达数据的特点,提出一种基于CMST聚类方法的分步的特征基因选择方法,然后,在分步的特征基因选择方法中引入“GapStatistic”理论,以确定特征基因数目,提出一种自适应的特征基因的选择方法,弥补目前的特征基因选择算法中缺乏较好的基因数目预置机制的不
3、足。第二,利用主分量分析方法(PCA)和独立分量分析方法(ICA)挖掘基因表达谱中隐含的基因表达模式,揭示癌症中基因的调控机制,通过抽样来选取特征基因子集以减少噪声对PCAF和ICAP的影响,并且根据基因子集中隐含模式的相似性来重构基因表达,提出一种基于隐含变量模型的癌症检测算法。第三,利用癌症组基因表达存在的局部特征相关性的生物病理特点,提出DNA微阵列基因表达谱中癌症组关联空间的概念,抽取不同癌症组基于关联空间的基因特征模式,研究与癌症组相关联的基因表达模式在癌症组中的表达以及调控,并提出适合癌症组相关联的基因表达模式的癌症预测算法,有效缓解基因数据集中“维数灾难”的问题
4、。第四,由于不同的特征选择方法采用不同的搜索机制和评价策略,挑选出的特征基因偏向癌症特征的不同方面,因此不同方法选择的特征基因明显不同,导致分类器的识别结果不稳定。针对癌症组基因数据和基因组数据构建一组具有互补性分类器,提出一种组合分类算法提高癌症分类算法的泛化性能。萆十儆辨别苹嘲发迓谱数掘,}勺穗痹抢测研究第五,从基因之间的协同表达来分析基因数据,研究具有可解释的基因表达模式。在显现模式的提取中增加虚拟样本以挖掘具有更高辨识能力的显现模式,并在候选分割点选择策略中通过高斯分布来模拟分割点的分布,提高分割点选择的可靠性,然后提出两种基于显现模式的癌症检测算法。关键词:DNA微
5、阵列;基因表达谱;癌症检测;特征基因;基因调控;基因表达模式1l第1章绪论在多年的癌症(疾病)研究中,科学家和医学工作者们认识到,癌症并不只是某一种疾病,在它的背后,隐藏着形形色色,变化多端的种类,存在着几百种这样的癌症。它们为什么一直难以攻克呢?其主要的原因是由于每一种癌症都有自己的特点,一种药物并不能对各个不同组织的癌症都能产生疗效,有些能抑制住肿瘤细胞,但有些却毫无作用,甚至在病症上相同的癌症,也无法用一种药物达到治疗的目的。随着人类生命科学的发展,人们对于基因这一有关人类生长、发育、衰老、遗传的最重要和最本质的因素,有了新的认识,并逐渐开始将基因引入对疾病的诊断、治疗
6、、药物研制、药物筛选等方面。因此,基因诊断、基因治疗,药物基因组图等应运而生。通过基因进行疾病诊治是对传统诊治方法提出的巨大挑战,成为人们关注的焦点。20世纪90年代初开始实施的人类基因组计划(HumanGenomeProject,HGP)与20世纪40年代制定的曼哈顿原子弹计划(ManhattanProject)以及60年代制定的阿波罗登月计划(ApolloProject)并称为美国的三大国家计划。人类基因组计划是由美国科学家于1985年率先提出”’“,旨在阐明人类基因组30亿个碱基对(BasePaits)的序列,发现所有人类基因,并搞清其在染色体(Chromosome)上
7、的位置,破译人类全部遗传信息,让人类第一次在分子水平上全面地认识自我,该计划1990年正式启动。英、日、德、法随后相继加入该计划,值得关注的是1999年中科院基因组中心代表中国正式加入该计划,承担了1%人类基因组的测序任务。2001年2月,人类基因组草图宣布完成““。随着以测序为主的结构基因组计划(StructuralGenomicsProject)的完成,生命科学研究的重点也逐渐的转变为以对基因功能研究为主的功能基因组计划(FunctionalGenomicsProject)。功能基因组计划的主要任务
此文档下载收益归作者所有