基于人类表型本体的基因和疾病关联关系分析方法研究

基于人类表型本体的基因和疾病关联关系分析方法研究

ID:34873061

大小:4.37 MB

页数:79页

时间:2019-03-13

基于人类表型本体的基因和疾病关联关系分析方法研究_第1页
基于人类表型本体的基因和疾病关联关系分析方法研究_第2页
基于人类表型本体的基因和疾病关联关系分析方法研究_第3页
基于人类表型本体的基因和疾病关联关系分析方法研究_第4页
基于人类表型本体的基因和疾病关联关系分析方法研究_第5页
资源描述:

《基于人类表型本体的基因和疾病关联关系分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于人类表型本体的基因和疾病关联关系分析方法研究METHODRESEARCHONRELATIONSHIPOFGENEANDDISEASEBASEDONHUMANPHENOTYPEONTOLOGY邵玉凯哈尔滨工业大学2015年12月国内图书分类号:TP391.1学校代码:10213国际图书分类号:004.8密级:公开工程硕士学位论文基于人类表型本体的基因和疾病关联关系分析方法研究硕士研究生:邵玉凯导师:王亚东教授申请学位:工程硕士学科:计算机技术所在单位:深圳研究生院答辩日期:2015年12月授予学位单位:哈尔滨工业大学Classif

2、iedIndex:TP39U.D.C:004.9DissertationfortheMaster’sDegreeofEngineeringMETHODRESEARCHONRELATIONSHIPOFGENEANDDISEASEBASEDONHUMANPHENOTYPEONTOLOGYCandidate:ShaoYukaiSupervisor:Prof.WangYadongAcademicDegreeAppliedfor:Master’sDegreeofEngineeringSpeciality:ComputerTechnologyAffilia

3、tion:ShenzhenGraduateSchoolDateofDefence:December,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要下一代基因测序技术加快了基因数据产生的速度,如此大的数据量,使得如今的难题从测序转向如何有效的利用已经产生的基因数据。表型是指受基因、环境等影响而在生物体上表现出来的特征,因而表型和基因以及疾病等有着密切的联系。现如今表型学已经是基因和疾病之间的重要纽带,而对表型的研究已是预测和发现致病基因的

4、重要手段。目前在基因、表型和疾病之间的关联方面的研究方法主要有三种。一个是利用现有的生物医学文献,用文本发掘等相关技术发掘生物医学实体之间的关系。另外一种是利用已有的关系建立起表型、疾病、蛋白质、基因等实体间的网络,在网络中发现新的关系。最后一种是利用本体,如基因本体、表型本体等结构化的知识系统来计算实体间的相似关系。它们之间各有优缺点。研究基于本体的表型相似度计算方法能够帮助预测病人的致病基因和疾病,充分利用本体的价值。本文主要利用人类表型本体(HumanPhenotypeOntology,HPO)作为工具来研究基因和表型之间以及疾病和表型之

5、间的相似性关系,进而预测病人的致病基因和疾病。本文在基于人类表型本体中表型信息量的基础上结合本体的有向无环图结构,提出一种基于人类表型本体中通路的相似性计算方法。经验证,该方法在预测致病基因和疾病时,在不同的数据集(理想、含噪声、含不准确以及含噪声和不准确)上的效果均优于其他基于本体的主流方法。例如本文方法在预测致病基因的含噪声和不准确数据集上比第二好的Resnik方法提高了17.3个百分点,在预测疾病的含噪声和不准确数据集上比此方法提高了18.1个百分点。有研究发现在疾病和基因网络中,同类的疾病、功能相关的基因在网络中表现出聚集特征。病人的身

6、上体现出来的表型特征中不可避免的出现一些和该疾病或者致病基因无关的表型(噪声表型),利用这种聚集特性可以筛选出一个表型集中噪声表型,可以提高致病基因和疾病预测的准确率。本文构建了表型网络,在表型网络中利用PageRank算法寻找中心表型和周边表型,从而挖掘表型集中的噪声表型,达到表型去噪的目的。经实验模拟,该方法能很好的发现噪声表型(平均逆序数为0.136),去噪能够提高预测致病基因和疾病的准确率。关键词:基因预测;表型;人类表型本体;表型网络I哈尔滨工业大学工程硕士学位论文AbstractTheemergenceoftheNextGenera

7、tionSequencing(NGS)technologyacceleratedthespeedofthegeneticdatagenerating.Suchalargeamountofdatamaketoday’sproblemfromsequencingtohowtoeffectivelyusethem.Phenotypesarecharacteristicsexpressedinorganism,whichinfluencedbygenes,environment,etc.Thus,phenotype,geneanddiseaseconn

8、ecttoeachotherclosely.Untilnow,thestudyofphenotypicisanimportantlinkbetween

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。