基于层次聚类和基因本体的蛋白质复合体预测研究.pdf

基于层次聚类和基因本体的蛋白质复合体预测研究.pdf

ID:51200664

大小:3.25 MB

页数:63页

时间:2020-03-21

基于层次聚类和基因本体的蛋白质复合体预测研究.pdf_第1页
基于层次聚类和基因本体的蛋白质复合体预测研究.pdf_第2页
基于层次聚类和基因本体的蛋白质复合体预测研究.pdf_第3页
基于层次聚类和基因本体的蛋白质复合体预测研究.pdf_第4页
基于层次聚类和基因本体的蛋白质复合体预测研究.pdf_第5页
资源描述:

《基于层次聚类和基因本体的蛋白质复合体预测研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、硕硕硕士士士学学学位位位论论论文文文基于层次聚类和基因本体的蛋白质复合体预测研究RESEARCHONIDENTIFYINGPROTEINCOMPLEXESBASEDONHIERARCHICALCLUSTERINGANDGENEONTOLOGY刘刘刘银银银海海海哈哈哈尔尔尔滨滨滨工工工业业业大大大学学学2012年年年6月月月国内图书分类号:TP391.3学校代码:10213国际图书分类号:681.37密级:公开工工工学学学硕硕硕士士士学学学位位位论论论文文文基于层次聚类和基因本体的蛋白质复合体预测研究硕士研究生:刘银海导师:王晓龙教授申请学位:工学硕士学科:计

2、算机科学与技术所在单位:计算机科学与技术学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.3U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONIDENTIFYINGPROTEINCOMPLEXESBASEDONHIERARCHICALCLUSTERINGANDGENEONTOLOGYCandidate:LiuYinhaiSupervisor:Prof.WangXiaolongAcademicDegreeAppliedfor:Mast

3、erofEngineeringSpecialty:ComputerScienceandTechnologyAliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要蛋白质复合体在各种细胞活动中都扮演了非常重要的角色。因此,如何有效地从蛋白质相互作用网络中预测蛋白质复合体成为生物信息学中一项重要的工作。蛋白质复合体具有高密度和核-附加结

4、构等拓扑特征;复合体预测即从大规模蛋白质网络中挖掘出符合复合体特征的子图。本文主要研究如何利用层次聚类和基因本体解决复合体预测中存在的三个挑战,从而提升复合体预测算法的性能。本文的主要研究内容包括以下几个方面:(1)本文将复合体预测问题转换为复杂网络中的社区发现问题,在分析了社区发现中经典的GN算法和HLC算法预测复合体的不足之后,通过融合HLC算法和核-附加结构提出了HLC-CA算法。实验结果表明HLC-CA算法的性能要明显好于其他主流算法。此外,本文推导出HLC-CA的时间复杂度比较低,适合于从大规模网络中挖掘复合体。(2)本文利用由基因本体计算出的蛋白

5、质之间的语义相似度去评估蛋白质相互作用的可靠性,从而解决蛋白质网络的假阳性问题。实验结果表明在处理过后的蛋白质网络上已有复合体预测算法的性能得到了显著的提升。此外,本文通过融合两个蛋白质网络证明解决蛋白质网络假阴性问题能够有效地提升已有算法的性能。(3)本文基于有监督学习的方法提出了SCGO算法。SCGO算法从基因本体中抽取出生物学特征表示蛋白质复合体,接着根据正反例复合体集合构建复合体分类器,然后利用复合体分类器过滤已有算法的预测结果。实验结果表明SCGO算法能够显著提升已有算法的准确率。关键词:蛋白质复合体预测;层次聚类;基因本体;语义相似度-I-哈尔滨

6、工业大学工学硕士学位论文AbstractProteincomplexesplayafundamentalroleinperformingcellularfunctions.There-fore,determininghowtoeectivelyidentifyproteincomplexesfromprotein-proteinin-teraction(PPI)networksisanimportanttaskinbioinformatics.Proteincomplexeshavetheirinherenttopologicalfeaturesinclud

7、inghigh-densityandcore-attachmentstructure.Theidentificationofproteincomplexesistominesub-graphswhichconformthefeaturesofcomplexesfromlarge-scalePPInetworks.Thisthesismainlyfocusesontacklingthethreechallengesexistingincurrentidentifyingcom-plexesalgorithms.Belowisalistofourmainresea

8、rchcontent.First,thisthesi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。