欢迎来到天天文库
浏览记录
ID:35101488
大小:5.31 MB
页数:59页
时间:2019-03-17
《集成特征选择与基因调控网络构建研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2?乂主禮^大葦DALIANUNIVERSITYOFTECHNOLOGY预±享恆巧文MAST巨艮ALDISSERTATION集成特征选择与基因调控网络构建研究学科去、11/计算机应用技术周广胃作者姓名孟军副教授指导教师2016年6月6日答辩日巧硕±学位论文集成特征选择与基因调控网络构建研究ResearchonEnsembleFeatureSelectionandConstructionofGeneula化rRegyNetworks作者姓名:周广博学科、专业:计算机应用巧
2、乂学号;21309174指导教师:孟军完成日期;2016.04.28夫金巧义大營DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中&经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他己申请学位或其他用途使用过的成果一。与我罔工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题
3、目:集成特化选搔与某因调挖网络构建巧宛作者签名:I為产碱日期=名^^//年月//日大连理工大学硕±学位论文摘要随着生物信息技术的快速发展,海量基因组数据的涌现进入后基因组时代,研究者不再局限于硏巧单个基因的功能,而是希望W系统的角度理解维持生物生命活动的复杂生命过程一,在这种背景下,系统生物学得到了快速发展。在系统生物学领域,挑战之就是基因调控网络的构建,基因调控网络W图形化的方式描述了基因之间的相互作用,通过逆向工程构建出基因调控网络可^文帮助我们更好的理解当环境条件发生波动时生物体内仍能保持稳定的分子机制。随着DNA微阵列技术
4、的发展,快速积累的基因表达数据。此外,基因序列数据和功能注释数据等,出现了大量的构建基因调控网络的方法。也在不断涌现不同类型数据往往提供了不同的信息,如何有效的利用多种数据源之间的互补性,对于准确构建基因调控网络至关重要。针对基于基因表达数据,利用特征选择方法进行基因调控网络构建的不足,即往往一仅给出网络中每条潜在边的重要性评分,而没有确定个合适的阔值将排序结果转化为nsemb-网络结构。本文提出了集成特征重要性遗传算法(EleFeatureImportanceGeneticAorm-lgith,EFIGA),结合集成特征选择算法和遗传算法构建基
5、因调控网络。首先利一用集成特征选择方法为目标基因的每个潜在调控者计算个重要性分值,该分值表示在该调控基因和目标基因间存在真实调控关系的可信度。然后利用遗传算法在具有较高可信度的调控者中筛选出最优的调控者子集。在逆向工程评估与方法对话(Dialoguefor民everseEngineeringAssessmentsandMethods,DREAM)数据集上的实验结果表明了该方法的有效性。为了应对外部环境刺激或者完成某种生命过程,转录因子通过调控目标基因来执行相应的功能共同参与同一生命过程,因此两者之间往往具有相同或相近的功能,考虑转录因
6、子和目标基因之间的功能相关性将有助于提高构建调控网络的准确性。本文提出了一ene种融合基因表达数据、基因序列数据!^及基因本体(GOntology,GO)数据构建基因调控网络的多特征融合方法,W有效运用不同数据源提供的相关特性提离基因调控网络构建的准确性。利用多种数据源构建特征向量,并使用支持向量机建立分类模型,预测转录因子和目标基因之间的调控关系。在拟南芥数据集和番茄数据集上的交叉验证结果表明本文方法具有更高的准确率。:关键词多数据源融合;基因调控网洛;集成特征选择;基巧本体--1集成特征选择与基因调控网络构建研究Research0
7、打EnsembleFeatureSelectio打a打dCo打structio打ofGeneReulatorNetworksgyAbs化actWiththerapiddevelopmentofbiologicalinformationtechnologytheemerenceof,gmastert*siveenomicdaaromotedhumanenterino巧enomeaenabledheiesearchersU)
此文档下载收益归作者所有