欢迎来到天天文库
浏览记录
ID:32151694
大小:6.53 MB
页数:46页
时间:2019-01-31
《基于智能算法的信息snp选择方法分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于智能算法的信息SNP选择方法研究插图索引图1.1单核苷酸多态性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.2图1.2HapMap的构建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3图1.3LD簇中选取TagSNP位点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5图1.4基于智能算法的信息SNP选择框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8图2.1信息SNP选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11图2.2非信息SNP预测⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11图2.3标签SNP选择贪婪算法。⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯13图2.
2、4数据集的最优分离超平面示图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21图2.5人工神经网络的系统模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯22图2.6神经元通用功能模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯23图3.1单极性S型变换函数⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31图3.2本文方法流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯33图4.1模块交互图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯36图4.2系统界面⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..36图4.3TRMP8的测试输出⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
3、⋯⋯⋯⋯..37图4.4TRM8数据集的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.40图4.55q3l数据集的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯40图4.6ENm013数据集的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..41VIT程硕二匕学位论文附表索引表3.1原始单体型数据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯25表3.2编码后单体型数据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯26表4.1数据集属性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.38表4.2TRPM8的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41表4
4、.35q3l数据集的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41表4.4ENm013数据集的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..41表4.5模拟数据集simulationl的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42表4.6模拟数据集simulation2的平均预测准确度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42表4.7运行时间比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42VII工程硕士学位论文1.1研究背景第1章绪论在1986年的Science上,诺贝尔奖获得者RenatoDulbecco发表了划时代的重要短文《肿瘤研究的转折点:人类基因组测序》。文章
5、中指出:如果我们希望更多更深层地了解肿瘤,我们必须从现在起关注细胞的基因组¨。J。于20世纪80年代提出的人类基因组计划(Humangenomeproject)向世界展示了人类基因组上包含的30亿个碱基对的序列。研究发现,尽管任意两个不相关个体的全基因组序列上有着99.9%的相似性,但却仍然存在着0.1%的差异【4~6】,而正是由这些微小的差异造成不同个体之间罹患疾病的风险不同以及对药物的反应差异。而在基因组水平上由于单个核苷酸位点上存在的转换(如C与T互换,在其互补链上则为G与A互换)或颠换(如C与A,G与T,G与G,A与T互换)等变异所引起的DNA序列多态性,被称为
6、单核苷酸多态性(SNPs,SingleNucleotidePolymorphisms),如图1.1中所示当随机分析比较两个个体的7号染色体上一段DNA序列(包含2200个核甘酸)时,可以发现两个单核甘酸多态位点(SNPs)【71。核苷酸多态性研究是目前生物信息学领域中的重要课题之一【81。由美国国立人类基因组研究院和SNP研究委员会(TheSNPConsortium,TSC)共同合作开展的针对单核苷酸变异(SNP)的大规模研究显示,单核苷酸变异(SNP)能够为研究多基因复杂疾病以及个体间患病风险与药物反应等课题提供许多不相同的新方法。在人类基因组中,现已发现大约3.4百
7、万个SNP,也就是在每1200基对(basepairs)中就有一个SNP,并且随着研究的深入,越来越多的SNP被识别。由于SNP具有数量大,分布广,高度稳定,易于自动化分析等特点【91,SNP被普遍认为是继第一代限制性片段长度多态性标记以及第二代微卫星即简短串联重复标记之后的第三代基因遗传标记,倍受研究人员关注。最重要的是,SNP作为一种可以早期检测的变异,.研究人员利用SNP的高分辩率基因作图为全基因组连锁分析或关联分析提供可靠的遗传信息,分析不同个体或群体对于疾病的易感基因,或者筛选出与复杂疾病(如肿瘤)或性状相关的重要基因等。因此,
此文档下载收益归作者所有