欢迎来到天天文库
浏览记录
ID:31359804
大小:109.50 KB
页数:8页
时间:2019-01-09
《基于多目标优化的进化算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于多目标优化的进化算法研究 摘要:自21世纪初,人类基因组序列图谱公开发表后,生命科学的研究中心已经从基因组学(Genomics)转变为蛋白质组学(Proteomics)。在生物信息学(Bioinformatics)领域,从蛋白质的一维氨基酸序列中预测蛋白质的三维结构及功能,已经成为该领域最重要、最活跃的课题之一。蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是基础理论还是方法方面难度均比较大。为了进一步提高蛋白质结构及功能的预测方法的可理解,揭示蛋白质结构与功能的深层次对应关系,从多目标优化角度,将该问题转化为多目标问题求解,研究基于多目标优化的蛋
2、白质结构及功能预测的智能算法。 关键词:多目标优化;蛋白质结构及功能预测;进化算法 中图分类号:TP391文献标识码:A文章编号:1009-3044(2016)13-0171-02 1990年10月1日,美国国会正式批准并启动了人类历史上规模最大的科研工程“人类基因组计划”(HumanGenomeProject)。2001年2月,人类基因组序列图谱公开发表,这意味着后基因时代的到来,随后生命科学(life8science)的研究重心从基因组学(Genomics)转变为蛋白质组学(Proteomics),及在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋
3、白相互作用等。生物信息学(Bioinformatics)作为生命科学的一个重要科学分支,它是以计算机为工具对生物信息进行储存、检索和分析的科学。具体而言,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。其中,从蛋白质的一维氨基酸序列中预测蛋白质的三维结构及功能,已经成为该领域最重要、最活跃的课题之一。 蛋白质结构及功能预测问题的研究,对揭示蛋白质的表达规律和生物功能提供新的辅助手段,对解释遗传病及传染疾病的生理机制、制备高效安全的生物药剂等复杂的现实应用问题亦具有很高的理论价值和指导意义。如果
4、弄清楚蛋白质的一级结构是如何决定其三级结构这个基本问题,将会使人们更系统和完整地理解具有生物活性蛋白质的传递全过程,使中心法则[2]得到更加完整的阐明,从而对生命过程中的各个现象有进一步的深刻认识,最终推动生命科学的快速发展。 蛋白质结构复杂,种类千变万化,虽然蛋白质结构及功能预测的研究已经取得了一定的成果,对于简单的蛋白质预测已经达到较高的水平,但是在实际较复杂的蛋白质预测上的应用还有很大的一段距离。需要解决的关键技术以及面临的困难还有很多,仍然有一些重要的理论和应用问题尚待解决。 为了进一步研究蛋白质结构及功能预测的研究,提高计算方法的有效性及可理解性,揭示蛋白质天然结构的生理
5、机制,从多目标优化角度,同时结合进化算法,将其与多目标优化结合起来,研究基于多目标优化的进化算法,提高搜索效能从而为系统的研究蛋白质结构及功能提供了一定的理论基础和实验平台。8 1蛋白质结构及功能预测的研究分析 1.1蛋白质结构及功能预测的现状分析 蛋白质结构复杂,种类千变万化,虽然蛋白质结构及功能预测的研究已经取得了一定的成果,对于简单的蛋白质预测已经达到较高的水平,但是在实际较复杂的蛋白质预测上的应用还有很大的一段距离。需要解决的关键技术以及面临的困难还有很多,仍然有一些重要的理论和应用问题尚待解决。 1)理想的能量函数并不存在。根据C.B.Anfinsen的观点,蛋白质的
6、活性结构像对应于体系能量最小的状态,在一定条件可以认为是能量最小的状态。该函数是一个重要的评价函数,用以区分天然结构和错误结构。在实际应用中,蛋白质机构复杂,可变参数过多,理想的能量函数并不存在。目前用于蛋白质机构预测的能量函数,不论是统计意义上的还是物理意义上的,都是在一定条件下的拟合,正确程度并不高。同时考虑到模型的复杂性,能量函数多忽略溶剂、氢键、疏水性等因素这对正确预测蛋白质结构及功能带来不利的影响。 2)二级机构预测准确度低。一般的预测方法,考虑到减少计算的复杂性,蛋白质的三级结构预测是根据二级结构的预测的结果、蛋白质的结构类型和折叠类型预测的结果以及空间结构的立体化学性质
7、,搭建出最后的蛋白质空间结构。而二级结构预测基本是以总结已知蛋白质结构规律的基础上而建立的,总体来说准确度不超过65%,这已经成为蛋白质结构及功能预测的一个较严重的制约条件。8 3)构象空间巨大。典型的蛋白质含有几百个氨基酸、上千个原子。所有可能的序列到空间结构的映射数目,随氨基酸残基个数而成指数级增长,即使使用简化后的contactmaps模型或torsionangles模型,也是一个天文数字。使用常规的搜索算法,计算量特别大,搜索效率低。
此文档下载收益归作者所有