欢迎来到天天文库
浏览记录
ID:37030165
大小:4.70 MB
页数:103页
时间:2019-05-17
《基于机器学习的影像遗传学分析及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP391论文编号:102871617-B004学科分类号:0812博士学位论文基于机器学习的影像遗传学分析及其应用研究研究生姓名郝小可学科、专业计算机科学与技术研究方向智能计算与机器学习指导教师张道强教授南京航空航天大学研究生院计算机科学与技术学院二О一七年七月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofComputerScienceandTechnologyResearchonMachine-Learning-BasedImagingGeneticsAn
2、alysisandtheirApplicationsAThesisinComputerScienceandTechnologybyXiaokeHaoAdvisedbyProf.DaoqiangZhangSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofDoctorofPhilosophyJuly,2017南京航空航天大学博士学位论文摘要近年来,随着多模态神经影像技术和基因检测技术的发展,影像遗传学这一交叉学科在研究中能够运用脑影像技术将人类大脑的结构与功能作为表型来评价基因对个体的影响,使得人们可
3、以在脑的宏观水平上以更客观的测量方式理解基因对行为或精神疾病的影响。而机器学习方法作为基于数据驱动的关联分析强有力工具,能够充分利用生物标志数据内在的结构信息构建模型来分析易感基因与大脑结构或者功能的相关性,从而更好地揭示脑认知行为和相关疾病的产生机制。本论文基于机器学习的理论和应用技术,围绕影像遗传学分析中的四个方面开展研究工作:(1)多个基因位点变异对单个脑区的影响;(2)单个基因位点变异对多个脑区的影响;(3)多个基因位点变异与多个脑区性状的关联;(4)多个基因位点变异与多个脑区性状的动态关联。主要工作和创新点如下:(1)为充分利用单核苷酸多态性SNPs特征之
4、间层次关系等结构信息,本文提出一种基于树型结构诱导的稀疏学习方法来检测与神经影像某候选脑区数量性状相关联的基因位点SNPs。具体而言:首先,通过先验知识建立树型结构,即将每个SNP位点作为树的叶子节点,将若干SNP位点连锁不平衡形成的LD组块以及基因组作为中间节点,进而引入特征的层次关系。进一步,对多SNPs位点回归候选脑区数量性状这一问题采用基于树型结构引导的稀疏学习方法进行特征选择。最终,采用特征选择中具有辨识度的SNPs进行脑区数量性状的预测。在ADNI数据集上,实验结果表明,提出的方法不仅能显著提高回归性能,而且检测出具有空间聚类特性和功能解释意义的风险基因
5、SNPs位点。(2)为充分利用样本的诊断判别标记与多模态脑影像数据表型的互补信息,以提高检测风险基因SNP位点与多脑区数量性状关联的性能,本文提出一种基于诊断信息诱导的多模态神经影像生物标志与风险基因的关联分析方法。具体而言:首先,考虑到特定疾病(例如,阿尔茨海默病AD)的风险基因型(例如,APOEe4)应该与该疾病的表型数量性状高度相关,引入类别相似性度量约束,来帮助诱导出更具判别力的脑影像标志特征作为基因型与疾病状态之间桥梁。其次,考虑到多模态的影像技术能够更好地刻画相同脑区的不同结构和功能特性,因此利用组稀疏正则化约束,选择具有与风险基因型和疾病状态同时相关的
6、鲁棒的一致性脑区特征。最后利用加速近似梯度APG算法解决优化的问题。在ADNI数据集上,实验结果表明,相比传统的单模态遗传影像关联方法,所提出模型能够获得了更好的关联性能,并且实现了从基因型到表型再到诊断链式关联的多模态一致性脑区特征选择。(3)为充分利用样本数据的临床评估等辅助信息(例如,认知得分量表或者诊断标记)来诱导多基因位点SNPs与多脑区数量性状关联分析,本文提出一种基于临床评估诱导的三路多变量稀疏典型相关分析模型,用于计算并挖掘输出相关的基因与影像关联。具体而言:I基于机器学习的影像遗传学分析及其应用研究将传统的双模态多变量稀疏典型相关分析模型扩展到多路
7、之间两两关联,即通过增加引入临床评估信息分别诱导约束其与基因位点SNPs和脑区数量性状之间的关联,然后使用一种轻量级的迭代算法来解决多路关联模型的优化问题。在ADNI数据集上,实验结果表明,相比较传统的双模态多变量稀疏典型相关模型,所提出的三路稀疏典型相关分析方法能提高多基因SNPs位点与多脑区数量性状的关联性能,并且有效地检测出与临床评估相关的基因位点和脑区生物标志特征。(4)为充分利用脑影像表型数量性状的纵向数据来挖掘在神经退行性疾病中基因对随时间变化的脑结构的影响,本文提出一种基于时间约束诱导的组稀疏典型相关分析模型。具体而言:首先考虑到受致病基因SNPs
此文档下载收益归作者所有