基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf

基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf

ID:35008054

大小:3.56 MB

页数:71页

时间:2019-03-16

基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf_第1页
基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf_第2页
基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf_第3页
基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf_第4页
基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf_第5页
资源描述:

《基于异构网络和机器学习的长非编码RNA-疾病关联关系预测.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于异构网络和机器学习的长非编码RNA-疾病关联关系预测PREDICTIONOFLNCRNA-DISEASEASSOCIATIONBASEDONHETEROGENEOUSNETWORKANDMACHINELEARNING徐志鑫哈尔滨工业大学2018年6月国内图书分类号:TP39学校代码:10213国际图书分类号:004.9密级:公开工学硕士学位论文基于异构网络和机器学习的长非编码RNA-疾病关联关系预测硕士研究生:徐志鑫导师:王亚东教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工

2、业大学ClassifiedIndex:TP319.3U.D.C:681DissertationfortheMasterDegreeinEngineeringPREDICTIONOFLNCRNA-DISEASEASSOCIATIONBASEDONHETEROGENEOUSNETWORKANDMACHINELEARNINGCandidate:XuZhixinSupervisor:Prof.WangYadongAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnol

3、ogyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要长非编码RNA(longnoncodingRNAs)是一类长度超过200个核苷酸的非编码RNAs,大量研究表明,lncRNAs在许多重要的生物过程中起着关键作用,并且其突变和失调与许多疾病有关。然而通过生物实验方法来识别lncRNA和疾病的关联是费时费力的。有效的计算方法

4、将有助于人类对疾病分子机制的理解,并有助于寻找疾病诊断,治疗和预防的生物标志物。本文主要研究使用计算方法来预测lncRNA-疾病关联关系。生物网络方法已经应用于多个生物信息领域,本文利用已知lncRNA-疾病关联关系数据,lncRNA表达相似度,疾病语义相似度等得到了lncRNA-lncRNA相似度矩阵和疾病相似度矩阵。并通过相似度矩阵构建了lncRNA-疾病异构网络,通过在异构网络上进行双随机游走算法,对未知的关联进行预测,在对已知数据上的LOOCV下AUC值达到了0.9374,五折交叉验证下达到了0.8504,高于其它几种对比的方法。基于异构网络的模型对于高

5、关联疾病的预测和对新疾病的预测都表现出良好效果。另外,通过将方法应用于复杂疾病进行案例研究,说明了方法的有效性。而且,方法可以同时对所有疾病进行预测。机器学习方法对于解决例如像推荐系统等问题有很多的应用,利用已知的长非RNA-疾病关联关系,通过引入miRNA和疾病的相关信息,本文计算了新的lncRNA相似度矩阵,并通过疾病间的关系扩展了数据集。通过引入堆叠自编码器和多层神经网络,提出了能够提取数据高层特征的基于神经网络的机器学习模型,以及通过集成方法将多个基分类器进行有效组合的集成模型,两个模型在新数据集上,五折交叉验证下分别达到了0.9041和0.9072的A

6、UC。模型也能够对miRNA-疾病关联关系进行预测,并能到达很好的效果。在噪声数据下的结果证明了模型较好的鲁棒性。此外,对前列腺癌,肺癌和胃癌三个疾病的案例研究进一步证明了其预测未知lncRNA-疾病关联关系的能力。同时,模型可以对没有任何已知关联关系的疾病进行预测。本文提出了基于异构网络的方法和基于机器学习的方法来预测lncRNA-疾病关联关系,在实验相关指标和案例分析中都获得的很好的结果,因此,方法可能对未来生物医学研究是一个很好的补充。最后,本文对所提出的模型方法进行了总结,并对未来的研究进行了展望。关键词:长非编码RNA,疾病,关联关系,计算方法,异构网

7、络,机器学习-I-哈尔滨工业大学工学硕士学位论文AbstractlncRNAs(longnoncodingRNAs)arekindofnoncodingRNAswithmorethan200ntnucleotidesinlength.ThereareincreasingevidencesshowingthatlncRNAsplaykeyrolesinmanybiologicalprocesses,andmutionsinanddysregulationofthemhavebeenproventobecorrelatedwithabroadrangeofhuman

8、diseases.How

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。