基于深度学习的蛋白质残基相互作用预测

基于深度学习的蛋白质残基相互作用预测

ID:35181875

大小:6.01 MB

页数:71页

时间:2019-03-21

基于深度学习的蛋白质残基相互作用预测_第1页
基于深度学习的蛋白质残基相互作用预测_第2页
基于深度学习的蛋白质残基相互作用预测_第3页
基于深度学习的蛋白质残基相互作用预测_第4页
基于深度学习的蛋白质残基相互作用预测_第5页
资源描述:

《基于深度学习的蛋白质残基相互作用预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:1胆85学号;20]34227似2誦襄审、考?UNI;.SOOC甘OWVER別TY:^^liF基于深度学习的蛋白质残基相互?作用预测……—:De邵LearningBasedPre出c.tionofPro化in及esi加eContact一研究生姓名曹成远m指导獅燃旨强(教授)专业名称计龍群端术研究方向生物信息学自所在院部计龍科学与技术fV做較日期2016年5月mt去.苏州大学学位论文独创性声明本人郑重声明

2、所提交的学位论

3、文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研充作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。论文作者签名g嘈戍匡L日期:'∫J·r历苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致ρ苏州大学有权向国家图书馆、中国社科院文献信息情报中心、中国科

4、学技术信息研究所(含万方数据电子出版社)、中国学术期刊(光盘版)电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文口本学位论文属廴~多~月解密后适用本规定。非涉密论文舀论文作者签名g茗嘁L日期:冫J,r、”`∫导师签各日肌诫冖基基基于于于深深深度度度学学学习习习的的的蛋蛋蛋白白白质质质残残残基基基相相相互互互作作作用用用预预预测测测摘摘摘要要要残基对的相互作用描述了蛋白质三维结构中一对残基的空间距离关系,相互作用的

5、残基对对维护蛋白质结构的稳定起着重要作用。蛋白质中所有残基对的相互作用关系确定了蛋白质三维结构的二维拓扑,所以得到准确的残基对相互作用关系对蛋白质三维结构预测有重要意义。残基对相互作用预测,特别是长范围残基对相互作用预测的准确率一直很低。这主要是因为残基对特征与残基对相互作用的高度非线性,另外残基对正负样本比例的严重失调也降低了模型的泛化能力。本文研究了基于双向递归神经网络的深度序列模型以及减轻样本比例失调影响的训练算法。双向递归神经网络模型不仅可以接收变长的蛋白质序列特征,而且它在处理残基特征的时候也不需要指定滑动窗口大小,但滑动窗口却是普

6、通浅学习方法所需要的。本文的训练算法在控制正负样本比例的同时,动态地选择输入给分类模型的样本。深度神经网络通过大量非线性变换把原始特征转换为高级特征,这种变换很适合残基相互作用预测这样的应用问题,但深度神经网络由于包含多层神经网络又会使超参数的选择成为难题。本文基于Hyperopt超参数优化框架实现了深度序列模型的并行超参数优化。通过快速的并行搜索,我们找到了一个与人工花费大量时间搜索到的模型不相上下的模型。这个模型在多个测试集上获得的中范围残基相互作用预测准确率超过其它方法10%以上,在长范围残基相互作用上的预测结果和当前流行方法不相上下。

7、关键词:残基相互作用;深度学习;递归神经网络;训练算法;超参数优化作者:曹成远指导教师:吕强IDeepLearningBasedPredictionofProteinResidueContactAbstractResiduecontactdescribesthespatialdistancebetweenapairofresiduesinproteinthree-dimensionalstructure,thecontactedresidue-pairsplayanimportantroleonthestabilityofproteinstr

8、ucture.Thecontactrelationshipsofallresidue-pairsinproteindeterminethetwo-dimensionaltopologyofproteinthree-dimensionalstructure,soitisveryimportanttoobtainaccuratecontactrelationshipsforthepredictionofproteinthree-dimensionalstructure.Theaccuracyoftheresiduecontactpredictio

9、n,especiallylongrangecontact,hasbeenverylow.Themainreasonisthatthehighnonlinearity

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。