基于拓扑结构与基因本体的蛋白质复合物识别算法研究

基于拓扑结构与基因本体的蛋白质复合物识别算法研究

ID:33549719

大小:12.39 MB

页数:67页

时间:2019-02-27

基于拓扑结构与基因本体的蛋白质复合物识别算法研究_第1页
基于拓扑结构与基因本体的蛋白质复合物识别算法研究_第2页
基于拓扑结构与基因本体的蛋白质复合物识别算法研究_第3页
基于拓扑结构与基因本体的蛋白质复合物识别算法研究_第4页
基于拓扑结构与基因本体的蛋白质复合物识别算法研究_第5页
资源描述:

《基于拓扑结构与基因本体的蛋白质复合物识别算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号:10532学密号:S11102045级:普通湖南大学硕士学位论文基于拓扑结构与基因本体的蛋白质复合物识别算法研究堂僮由遣厶丝名!垂型!垩昱垣丝刍壁驱整!整塞焦麴援墙菱望僮!焦息型堂皇王猩堂暄童些刍整!让篡扭型堂皇撞盔途室提窒旦塑;2Q!垒生三旦15旦诠室筌避旦期;2Q!垒生鱼旦垒旦筌趱委员全圭廑;壑这麴援ResearchonalgorithmofidentifyingproteincomplexesbasedonGeneOntologyandnetworktopologyinprotein—proteininteractionnetworkbyWANGXia

2、opingB.E.(JiangxiNormalUniVersity)2008AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineering1nComputerScienceandTechnologyintheGraduateSchoolofHunanUniversitySupervisorProfessorLU0JiaweiMay,2014湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标

3、注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:秒知\日期:∥中年6月参日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1.保密口,在年解密后适用本授权书。2.不保密团。(请在以

4、上相应方框内打“√”)作者签名:导师签名:日期:少cP年‘月6日日期:扣f中年6月6日基于拓扑结构与基因本体的蛋白质复合物识别算法研究摘要识别蛋白质相互作用网络中的复合物和功能模块对于理解生物系统的组织和功能具有重要的意义。随着高通量技术的发展,大规模蛋白质相互作用数据可以获得,从大规模蛋白质网络中挖掘蛋白质复合物正成为当前生物信息学研究的热点。然而,由于蛋白质网络中存在假阳性和假阴性以及蛋白质复合物拓扑结构的不确定性,所以,在蛋白质网络中准确高效地挖掘蛋白质复合物还存在很多挑战。针对这些问题,本文主要在蛋白质网络重构和复合物识别算法设计方面进行研究,主要研究工作包括

5、:针对目前能够获得的蛋白质相互作用数据存在较多噪声,直接从蛋白质网络中挖掘蛋白质复合物具有很大局限性这一事实,本文结合蛋白质网络拓扑信息与基因本体数据,提出了两种重构蛋白质网络的加权方法,即AdjustCD+GO和CD.distance+GO。选取了四种复合物发现算法和两个数据集DIP和Krogan进行实验,比较分析了本文提出的两种加权方法与其它两种加权方法(即AdjustCD和GO方法)的去噪性能。实验结果证明,本文的两个加权方法比其他两个加权方法去噪能力更强,能够更好的提高算法的特异性(Sp)、敏感度(Sn)、综合评价(F.score)。基于本文提出的加权方法Ad

6、justCD+GO以及复合物的拓扑特征,提出了一种基于加权网络的、核心-夕}、围复合物识别算法PCALG(ANovelProteinComplexIdentificationAlgorithmBasedontheIntegrationofLocalNetworkTopologyandGeneOntology)。在数据集DIP和Krogan上,与其它六种现有复合物识别算法,在五个评估指标,敏感度(Sn)、特异性(Sp)、综合评价(F.score)、覆盖率(Coveragerate)、p-value上进行比较。实验结果表明,PCALG算法能够更准确的识别蛋白质复合物,尤其

7、在特异性、综合评价以及P—value评估指标方面明显优于其他算法。关键词:蛋白质复合物;噪声网络;基因本体;加权网络;PCALG算法;拓扑结构II硕士学位论文AbstractTheidentificationofproteincomplexesandfunctionalmodulesinprotein—proteininteraction(PPI)networksisveryimportanttounderstandtheorganizationandfunctionofthebiologicalsystem.Alargedatasetofexper

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。