基于生物分子网络分析的疾病基因预测算法

基于生物分子网络分析的疾病基因预测算法

ID:34551035

大小:1.15 MB

页数:77页

时间:2019-03-07

基于生物分子网络分析的疾病基因预测算法_第1页
基于生物分子网络分析的疾病基因预测算法_第2页
基于生物分子网络分析的疾病基因预测算法_第3页
基于生物分子网络分析的疾病基因预测算法_第4页
基于生物分子网络分析的疾病基因预测算法_第5页
资源描述:

《基于生物分子网络分析的疾病基因预测算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于生物分子网络分析的疾病基因预测算法作者姓名虞佳导师姓名、职称高海昌副教授一级学科计算机科学与技术二级学科计算机软件与理论申请学位类别工学硕士提交学位论文日期2014年12月学校代码1010701学号1203121653TN82TP30密级公开分类号西安电子科技大学硕士学位论文基于生物分子网络分析的疾病基因预测算法作者姓名:虞佳一级学科:计算机科学与技术二级学科:计算机软件与理论学位类别:工学硕士指导教师姓名、职称:高海昌副教授提交日期:2014年12月DiseaseBiomarkerIdentificationBasedonBiomolecula

2、rNetworkAnalysisAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinComputerScienceandTechnologyByYuJiaSupervisor:Prof.GaoHaichangDecember2014西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢

3、中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文若有不实之处,本人承担一切法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分内容,允许采用影印、缩印或其它复制

4、手段保存论文。同时本人保证,获得学位后结合学位论文研究成果撰写的文章,署名单位为西安电子科技大学。保密的学位论文在年解密后适用本授权书。本人签名:导师签名:日期:日期:摘要摘要疾病影响着人类的正常工作及生活,复杂疾病,以癌症为代表,更是严重威胁着人类的生命安全。对疾病生物标记的研究有助于揭开潜在疾病的发病机制,并引导个性化的治疗。因此,疾病生物标记的研究受到越来越多的关注,成为了生物信息学研究中一个极其重要的分支。近些年来,随着高通量测序技术的发展,各种不同的生物数据大量涌现,疾病生物标记的研究进入了一个新阶段。已知疾病基因,作为已经在临床上被证实跟

5、疾病相关的基因,可以作为一种先验知识来指导研究。然而目前的大多数研究方法,只是把已知疾病基因作为对研究结果的验证数据,而没有作为先验知识去引导疾病生物标记的识别,本文研究中引入了这一数据作为先验知识。另外,大量生物数据的积累也推动了对各种计算方法的研究。在生物假说“同一疾病的蛋白质互相之间交互多”的基础上,研究者们通过在网络模型中计算各基因与已知疾病基因的距离,来预测疾病生物标记。这些距离度量方法包括基于最短路径、基于随机游走、扩散核等。扩散核能根据疾病网络的全局拓扑特性度量节点之间的距离,具有比较好的效果。本文研究中采用了扩散核(diffusion

6、kernel)思想。本文提出了一种以已知疾病基因集合引导的疾病网络的构建方法,并从构建的疾病网络中预测疾病相关基因。本文具体的研究思路如下:首先,从三个公共数据库中收集针对某种癌症的已知疾病基因,对每种癌症得到一个疾病基因集合。针对本文研究的六种癌症(肺癌,前列腺癌,乳腺癌,膀胱癌,大肠直肠癌,子宫内膜癌),共获得了六个基因集合。然后,采用扩散核思想在每一个疾病基因集合基础上构建一个疾病分子网络。扩散核在本文中被用来度量基因之间的相似性,旨在找出与已知疾病基因相似性高的基因,用于构建网络。最后,采用马尔科夫聚类算法(MCL)在疾病网络上进行聚类,并设

7、计了一种按聚类模块为单位的新颖的得分算法对疾病网络中除已知疾病基因以外的基因打分,从中筛选癌症相关基因并进行了一系列验证。另外,为了说明以疾病基因集合为疾病网络的初始节点集合的合理性,我们在PPI的最大连通图上比较了疾病基因与非疾病基因的拓扑特性差异。实验结果表明,本文的研究方法能比较有效地构建疾病分子网络,预测与特定癌症相关程度高的基因。从与经典的带重启的随机游走的预测方法的结果对比来看,本文方法预测的致病基因在已知疾病基因数据库中展现了更显著的富集性,对癌症样本和正常样本的分类效果也更好。本文的算法将从某种程度上揭示癌症的发病机理,并为深入了解癌

8、症的机制提供支持。I西安电子科技大学硕士学位论文关键词:PPI网络,疾病网络,拓扑特性,扩散核,生物标记论文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。