基因表达谱数值特性基因提取和分类方法概述

基因表达谱数值特性基因提取和分类方法概述

ID:24920196

大小:54.50 KB

页数:6页

时间:2018-11-17

基因表达谱数值特性基因提取和分类方法概述_第1页
基因表达谱数值特性基因提取和分类方法概述_第2页
基因表达谱数值特性基因提取和分类方法概述_第3页
基因表达谱数值特性基因提取和分类方法概述_第4页
基因表达谱数值特性基因提取和分类方法概述_第5页
资源描述:

《基因表达谱数值特性基因提取和分类方法概述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基因表达谱数值特性基因提取和分类方法概述第一章绪论1.1研究背景和意义肿瘤是指机体某一部分组织的某个细胞在各类致癌因素的影响下发生非正常变化,导致其不能完成基因水平上生长的调控作用而形生的赘生物细胞群。通常情况下,医学界将肿瘤分为良性肿瘤和恶性肿瘤。长久以来,人类健康都遭受着肿瘤疾病的困绕,其中恶性肿瘤以其顽固不容易被治愈而尤为突出,它不但带给人们身体上的疼痛感,更有心理上的无形压力,容易让人产生恐惧、悲伤甚至绝望的精神症状。根据世界卫生组织(RNA拷贝的转录情况。基因芯片通常是利用光导原位合成、显微打印等手段,以可寻址的形式有

2、序地、密集地原位合成成千上万的DNA寡核苷酸片段,或者将cDNA文库中已知和未知的探针序列固定到经过相应处理的玻璃芯片、尼龙膜、硝酸纤维素膜等载体表面上,这样就可以产生二维DNA探针阵列或突光标记祀DNA,与此同时根据核酸碱基之间的互补杂交原理,有目的性的选择杂交所需要的条件并杂交至芯片上。再结合激光扫描和计算机软件就能实现对基因的突变、表达情况或测序结果等信息进行大规模并行分析,让人们对复杂生物样品的整体分析成为可能。相对传统生物技术,这是一次具有深远意义的进步。基因芯片一般以尼龙或玻璃材质作为基底,芯片部分通常为正方形。由于

3、基因芯片的制备流程和应用对象的不同,可以从不同的角度将基因芯片划分为许多种类。依据基因芯片使用的载体原料来看,可分为玻璃芯片、膜芯片和桂芯片等,其中,玻璃芯片凭借其易得到、焚光背景低等优点在行业内被广泛使用。根据芯片载体上点的DNA种类的差异,可分为由美国Affymetrix公司率先发展的寡核苷酸微阵列和由美国Stanford大学首先发展的cDNA微阵列,其中,cDNA芯片因其IE基因检测时很好的特异性、较低的成本、相对简单的操作而被很多国家实验室和大型制药公司所采用。按照市场化分,基因芯片可以分为两类,一类为研究型微阵列,一类

4、为临床检验微阵列。第二章基因表达谱数据分析理论基础2.1基因表达谱数据的数学描述目前,基因芯片技术是分子诊断的一个重要技术措施。利用基因芯片,能够同时跟踪监测数以万计的基因在不同组织的表达水平,它不但有利于判别肿瘤组织的类型和挖掘新亚型,而且是肿瘤分子生物学研究的可靠科学依据。相对于传统分子生物学技术,基因芯片技术的效率提高了数万倍,因此也使之成为了后基因时代的首要研究工具。进行一次基因芯片实验就能获得成千上万甚至上亿个基因的信息数据,而随着基因芯片技术的高速发展,相应的基因表达谱数据的规模也在日趋庞大。因此,要最大限度的发挥基

5、因芯片技术的优势,关键就在于寻找实用、高效的数据处理方法,以及如何从海量数据中准确、快速地提取有用的信息。..2.2基因表达谱数据集1999年,Golub等利用通过基因芯片获得的白血病数据集实现了肿瘤亚型的分类,自此拉开了基于基因表达谱数据的肿瘤分子诊断的帷幕。随着研究的不断深入,越来越多的基因表达谱数据集被公布出来,表2-1列出了常见的几种基因表达谱数据集。此外,在基因芯片的分析中,我们经常需要査询该芯片的使用目的、实验条件和操作流程等等,然后才能对相应的样点信息数据进行分析处理,这些信息量是巨大的,因此,必须建立相关数据库对

6、这些数据实现有效管理。目前常见的专业基因芯片数据库如表2-2所示:数据量巨大。进行一次DNA微阵列实验可以同时获取成千上万甚至上亿个基因的信息数据,而这些数据中含有大量的冗余信息,且表达水平在正常和病变样本间只存在微小差异。它们对于分类的价值很小。在不剔除的情况下,由于数据量大致使分析过程耗时长,那么,算法的体性能就会下降,从而影响最终的分析结果,所以,剔除冗余基因是必不可少的操作。第三章基于邻域不定性信息和记分准则.........173.1多种记分准则.........173.2邻域不定性信息.........183.3特征

7、基因提取.........193.4K-近邻分类器.........203.5实验.........213.6本章小结.........24第四章基于随机游走的肿瘤基因表达谱数据分类.........254.1邻接矩阵和高斯加权Laplace矩阵.........254.1.1邻接矩阵.........254.1.2高斯加权Laplace矩阵.........274.2随机游走分类方法的理论研究.........274.3实验.........324.4本章小结.........34第五章总结与展望.........355.1论

8、文总结.........355.2研究展望.........35第四章基于随机游走的肿瘤基因表达谱数据分类随机游走是当前人们研究最早的一种随机过程。传统的方法在解决机器学习和数据挖掘问题时需要大量的先验知识或是严格的前提假设,所以当先验知识不足或者前提假设与现实

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。