资源描述:
《一种新型基因编码与基因算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第6卷第22期2006年11月科学技术与工程Vol.6No.22Nov.200622期1671-1815(2006)22-3567-06王卫东Sc:i一en种ce新Te型ch的no基log因y编an码dE及ng基in因ee计rin算g方法c2006Sci.Tech.Engng.一种新型的基因编码与基因算法王卫东(中国人民解放军总医院生物医学工程研究室,北京100853)摘要研究和发展模仿生物体行为和功能的计算理论和方法是现代信号与信息处理领域非常迷人的方向之一,神经计算和基因计算正是在这一方向上的杰作。科学家们至今对生物进化复杂
2、性和脑功能复杂性的理解还很不全面和深入,但是人们模仿其机制的计算在许多工程应用问题中已取得良好的效果。本文论述了生物体的基因编码和译码的基本原理,据此提出了基因计算的新框架和途径。关键词基因编码基因计算自然选择中图法分类号TP181;文献标识码A在生物进化过程中自然选择法则使得经历了亿杂的系统尤其如此,同时复制按几何增长;万年的生物体出人意料和不可思议。在达尔文(3)基因信息的复制过程必须伴随基因计算产(Darwin)看来,生物体产生的难以置信的特性实际上物(简称基因产物)的出现,生物体的自我复制是基是自然选择的结果,而且自然选
3、择总是在已有的基础因信息复制和基因计算产物出现的统一过程;之上进行着,以致一个简单的过程由于加上许多附属(4)基因信息复制过程中产生的错误(变异或机制后变得非常复杂和难以理解。自然选择是一种精突变)本身也应能被复制,这样有益的变异才能被美的机制,它是生物进化复杂性的根源,它将有益的自然选择所保留;偶然事件变成了必然事件。那么,在什么条件下自然(5)基因信息和基因产物应该在一起(避免互选择才能起作用呢?这是一个非常复杂的问题。然而,养),一个有效的办法就是用一个口袋(如细胞)将近百年来,在科学家们对此进行了苦苦寻求之后,答它们装在
4、一起;案已经略显端倪。倘若,将在上世纪以来建立的分子(6)基因产物必须为有限的时间和空间资源而生物学和孟德尔(Mendel)的遗传学补充进达尔文的相互竞争地生存着。《物种起源》的自然选择学说中,答案便简略地呈现在依据生物进化的基本条件和规律,早在1974年我们面前。生命的秘密就以本来面目出现。自然选择[1,2]Holland提出的基因算法(GeneticAlgorithms),以对生物进化如此有效的基本条件应是:及随后Fogel提出的进化规划(EvolutionProgramming)(1)生物体具有携带能被继承的“信息”载体,
5、和Rechenberg提出的进化策略(EvolutionStrategy)是能够被继承的“信息”被称做基因信息,基因信息由模仿生物进化的计算理论的代表性工作;但是,在有限个基因码元排成的基因序列所表达;这些代表性工作中构造算法常常会导致基因缺损(2)存在一种精确复制基因信息的生化机制,和无法实行全局搜索,其原因在于这些方法采用的这种复制过程会产生错误,但是错误必须很少,复基因编码体系是非完备的和基因译码体系是单值的,所以这些方法常常采用基因突变算子维补基因2006年7月10日收到国家自然科学基金(60571005)资助缺损和译码
6、单一。作者简介:王卫东(1964—),男,江苏人。工学博士(1994),中国人民本文研究生物体进化过程中遗传信息的表达、解放军总医院医学工程保障中心主任、生物医学工程研究室主任、传递、编码和基因计算,分析了自然选择在生物进研究员。研究方向:医学物理、医学影像、通信与电子系统、信号与信化过程的重要性、遗传信息中的冗余信息的作用,息处理和生物计算。E-mail:wangwd301@126.com;wang@mpe.pku.edu.cn。以及信息交叉规律的重要性。提出了一种新的基因3568科学技术与工程6卷计算的综合理论的框架。文中还
7、利用该理论框架计轮廓来看,有以下几点特征。算了工程应用问题。(1)生物体的基因信息是用互补的字母序列对来保存的,且互补字母是唯一的。这样可以减少基1生物体中基因编码机制因记录、修改和传递过程中的错误概率,同时消除在生物体中遗传信息的传递方向可以用图1基因缺陷和保持信息完备性。(b)所示流程图来表示。没有箭头是遗传信息不可(2)通常,组成基因序列(脱氧核糖核酸)的基传递出来,遗传信息通常按实线的方向传递,在很因码元(碱基)采用多联体形式表达基因码,基因码少的情况按虚线传递。请注意,无论如何蛋白质不元的多联体对应着唯一的目标码元(氨
8、基酸),多联能传递遗传信息,这就是所谓的中心法则。例如,流体与目标码元的对应关系称为基因码字典。行感冒病毒、脊髓灰质炎病毒是将遗传信息从DNA(3)基因计算是用基因码字典去翻译基因序传递给RNA。遗传信息从RNA到DNA的传递称为逆列,并用目标码元编写一系列目标