欢迎来到天天文库
浏览记录
ID:35071483
大小:2.73 MB
页数:60页
时间:2019-03-17
《基于马尔科夫覆盖的基因交互检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Nfv硕士学位论文基于马尔科夫覆盖的基因交互检测算法研究学科专业软件工程学位类型□科学学位√□专业学位研究生姓名胡宇翔导师姓名、职称谢民主教授论文编号湖南师范大学学位评定委员会办公室二零一六年五月分类号TP311.5密级公开学校代码10542学号201470110672基于马尔科夫覆盖的基因交互检测算法研究ResearchofGeneInteractionDetectionAlgorithmBasedonMarkovBlanket研究生姓名胡宇翔指导教师姓名、职称谢民主教授学科专业软件工程研究方向生物信息学湖南师范大学学位评定委员会办公室二零一六年
2、五月摘要贝叶斯网络是一种基于概率推理的图形化网络,贝叶斯网络中的马尔科夫覆盖则是一种根据变量间的关联性条件来寻找与目标变量相关集合的方法。研究发现贝叶斯网络中的马尔科夫覆盖方法适用于全基因关联分析中的上位性检测问题。近年来,一系列基于马尔科夫覆盖的上位性检测算法被提出,但是对于大规模的全基因组数据来说,这些算法依旧存在检测效率低和假阳性率高等问题。本文将就这些问题对基于马尔科夫覆盖的上位性检测算法进行进一步研究。为了提高已有的基于马尔科夫覆盖的上位性检测算法的性能,本文提出了一个优化的基于马尔科夫覆盖的上位性检测算法—OMBED(Optimized
3、MarkovBlanketforEpistasisDetection)算法。该算法共分为三个阶段:移除阶段、前向阶段和后向阶段。在移除阶段中,根据条件独立判断移除候选集合中的无关变量;在前向阶段中,利用G2测试值来衡量变量间关联性强度,将关联性强的变量加入到目标集合,将关联性较弱的变量移出候选集合,最终得到最小的马尔科夫覆盖变量集合;在后向阶段中,主要是移除马尔科夫覆盖集合中的假阳性变量。该算法在原有算法的前向阶段通过对加入和移出变量操作进行了优化,减少了变量G2测试次数,降低了算法复杂度。在一系列模拟数据集以及真实数据集上的实验结果表明,该算法具
4、有较好的检测效率,并降低了假阳性率。I关键词:全基因组关联分析;上位性;单核苷酸多态性;基因交互;马尔科夫覆盖IIAbstractBayesianNetworkisagraphicalnetworkbasedonprobabilisticreasoning,andaMarkovblanketofaBayesiannetworkisamethodtofindthesetofvariablesaccordingtoconditionsofassociationbetweenvariables.ManystudieshavefoundthattheMar
5、kovBlanketmethodinBayesiannetworkissuitableforepistasisdetectioningenome-wideassociationstudy.Inrecentyears,aseriesofepistasisdetectionalgorithmsbasedonMarkovblankethavebeenproposed,however,thesealgorithmsareinefficientandtheirfalsepositiveratesarehighforthelarge-scaledataofGW
6、AS.Facedwiththeseproblem,weintensivelystudytheepistasisdetectionalgorithmbasedonMarkovblanketinthispaper.InordertoimprovetheperformanceoftheepistasisdetectionalgorithmbasedonMarkovBlanket,weproposeanoptimizedepistasisdetectionalgorithm--OMBED(OptimizedMarkovBlanketforEpistasis
7、Detection).Thisalgorithmconsistsofthreephases:Removephase,ForwardphaseandBackwardphase.IntheRemovephase,independentvariablesareremovedfromthecandidatesetaccordingtoconditionsofassociationbetweenvariables.IntheForwardphase,usingG2testasthemeasureofindependencebetweenvariables,w
8、eobtaintheminimalMarkovBlanketvariablesetbyremovingtheweaklya
此文档下载收益归作者所有