基于布谷鸟搜索带假结rna二级结构预测

基于布谷鸟搜索带假结rna二级结构预测

ID:28093542

大小:65.62 KB

页数:5页

时间:2018-12-08

基于布谷鸟搜索带假结rna二级结构预测_第1页
基于布谷鸟搜索带假结rna二级结构预测_第2页
基于布谷鸟搜索带假结rna二级结构预测_第3页
基于布谷鸟搜索带假结rna二级结构预测_第4页
基于布谷鸟搜索带假结rna二级结构预测_第5页
资源描述:

《基于布谷鸟搜索带假结rna二级结构预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于布谷鸟搜索带假结RNA二级结构预测摘要:RNA在细胞中具有重要的结构、功能和调节作用。RNA单链的结构对于其在有机系统中的作用具有决定性影响,因此RNA结构预测成为研究热点。假结是一种重要但是难以预测的RNA结构。以热动力学模型与最小自由能量理论为基础,本文提出了一种称为CSRNA的基于布谷鸟搜索的启发式算法,用以预测带假结RNA二级结构。通过基于已知RNA序列的预测实验,本文比较了CSRNA与几种算法的预测结果,证明CSRNA算法的有用性及有效性。关键词:RNA二级结构预测;假结;最小自由能;布谷鸟搜索分类号:R857.3文献标识码:A1概述假结结构是一

2、类二级结构子结构,在两个或多个茎区出现交叉嵌套时形成,存在于多种RNA分子二级结构中。其中茎区是一种二级结构子结构,通过连续的三对或三对以上碱基配对形成。研究发现,假结结构对于RNA结构的作用具有重要的意义。RNA分子结构对于其作用有重要影响,其测定可通过X光测定、核磁共振成像等物理方法进行。但物理方法存在耗时长、财力物力开销大等缺点,限制了其使用。目前的研究主要通过软件计算方式预测RNA二级结构。早期的RNA结构预测算法主要是动态规划类型算法。这些算法具有不适用于较长的RNA序列、算法复杂预测计算耗时长等缺点。近期研究热点转向基于启发式算法的预测研究。2研究

3、现状目前主要预测算法采用最小自由能量模型作为建模基础。此模型认为在所有可能结构中自由能量最低的预测结构最有可能是给定序列的实际结构。通过实验及统计估算,可以指定出一系列自由能量计算规则,以计算出任何给定结构的自由能量。目前的主要算法分为动态规划和启发式两种。动态规划算法能够在理论上保证搜索到具有全局最小自由能量的结构,但时间复杂度高。启发式算法收敛速度明显比动态规划算法快,但不能保证得到具有全局最小自由能的结构是其主要缺点。目前主要的动态规划算法包括Reeder和Generics提出的pknotsRG-mfe算法和Dirks和Pierce提出的NUPACK的算

4、法。pknotsRG-mfe通过限制假结类型将时间复杂度低至。VanBatenburg等人通过引入遗传算法思想提出名为STAR的启发式算法,将问题转化为茎区组合优化进行搜索。Ren和Rastegari提出名为HotKnots的启发式算法,通过迭代添加可能的子结构建立候选结构。3CSRNA算法布谷鸟搜索算法(CuckooSearch,CS)是由Yang等于2009年提出的一种启发式优化算法,用以解决函数优化、最值搜索等问题。算法受布谷鸟在其他鸟类的巢中下蛋并由他人代为孵化这一繁殖行为启发。3.1目标函数CSRNA算法定义RNA结构自由能量函数作为算法的目标函数,

5、使用最邻近能量模型进行计算。一个结构的自由能通过将非假结子结构、H假结、复杂假结三者能量求和得到。非假结子结构包含茎区、发夹环、内环、凸环、多分支环、悬挂碱基和终端错配等二级结构子结构。CSRNA采用Mathews小组提出的能量参数计算上述子结构的能量。针对H型假结能量,CSRNA引入由Gultyaev和Batenburg、Dirk和Pierce[3]以及Cao和Chen提出的三组能量参数进行计算。针对复杂假结能量,CSRNA采用了将其拆分为多个非假结结构方式计算能量。3.2初始化处理初始化处理包括构造茎区池、构造初始解并排序两个步骤。首先定义两个茎区兼容指相

6、互不包含重复的碱基位。茎区池是一个存储给定RNA序列所有可能存在的茎区的线性表,表中每个茎区被赋予全局唯一的序号。每个解都是茎区池中相互兼容茎区的组合。4实验结果定义TP表示预测结构碱基对中出现在实际结构中的碱基对个数,FP表示预测结构碱基对中未出现于实际结构中的碱基对个数,FN表示真实结构碱基对中未出现在预测结构中的碱基对的个数。则可定义用于评价结果的敏感性指标为TP除以TP与FN的和,而确定性敏感性指标为TP除以TP与FP的和。表2确定性指标实验结果表结语在本文中,以解决带假结RNA二级结构预测问题,我们基于布谷鸟搜索提出了一种名为CSRNA的预测算法。通

7、过与目前主要预测算法进行对比实验,证明了CSRNA算法的有用性和有效性。在后续研究中,计划通过完善自由能量计算模型以提高预测准确率。此外,还计划针对构造领域解进行搜索和按比例淘汰部分解两项机制进行改造,以加强算法搜索能力,优化预测结果。参考消息[1]D.H.Turner,D.H.Mathews.NNDB:thenearestneighborparameterdatabaseforpredictingstabilityofnucleicacidsecondarystructure[J].NucleicAcidsResearch,2009,38:280-282.[

8、2]J.Reeder,P.Steffe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。