融合粒子群优化和遗传算法的基因调控网络构建

融合粒子群优化和遗传算法的基因调控网络构建

ID:31376487

大小:123.50 KB

页数:13页

时间:2019-01-09

融合粒子群优化和遗传算法的基因调控网络构建_第1页
融合粒子群优化和遗传算法的基因调控网络构建_第2页
融合粒子群优化和遗传算法的基因调控网络构建_第3页
融合粒子群优化和遗传算法的基因调控网络构建_第4页
融合粒子群优化和遗传算法的基因调控网络构建_第5页
资源描述:

《融合粒子群优化和遗传算法的基因调控网络构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、融合粒子群优化和遗传算法的基因调控网络构建  摘要:MicroRNA(miRNA)是一类大小为21~25nt的内源性非编码小核糖核酸(RNA),通过与mRNA的3’UTR互补结合,导致mRNA降解或翻译抑制来调控编码基因的表达。为了提高构建基因调控网络的准确度,提出一种基于粗糙集、融合粒子群(PSO)和遗传算法(GA)的基因调控网络构建方法(PSOGARS)。该方法首先通过对序列信息进行特征提取;然后采用粗糙集的依赖度作为适应度函数,融合粒子群和遗传算法选出较优的特征子集;最后使用支持向量机(SVM

2、)建立模型,预测未知的调控关系。在拟南芥数据集上进行实验,相比基于粗糙集和粒子群优化的特征选择方法和Rosetta算法,所提方法的预测准确率、F值和受试者工作特征(ROC)曲线面积最多能提高5%,在水稻数据集上最多能提高8%。实验结果表明所提方法能够比较准确地预测miRNA和靶基因之间的调控关系。  关键词:基因调控网络;粒子群优化;遗传算法;粗糙集;特征选择  中图分类号:TP399  文献标志码:A  文章编号:1001-9081(2016)11-2969-05  0引言  MicroRNA(m

3、iRNA)是一类非常重要的非编码核糖核酸(RiboNucleicAcid,RNA)分子,通过诱导靶基因降解,从而广泛地参与到基因的转录后调控,或者通过抑制基因的转录,13对基因在转录水平上进行调控[1]。miRNA通过与靶mRNA(messengerRNA)匹配结合实现对生物学功能的调控,因此,研究miRNA与其靶基因的调控关系成为生物界广泛关注的问题。传统的实验验证方法耗费巨大,利用现有的序列数据、基因表达数据或其他生物信息学数据,通过统计学模型或机器学习的方法构建基因调控网络来发现基因之间的关系

4、,能够有效减少实验花费,对生物学研究者有一定指导作用。  从机器学习的角度来看,基因调控网络构建可以分为非监督学习和监督学习。非监督学习不需要已知的调控关系,只是利用一些生物数据来进行调控网络的构建;监督学习则需要已知的调控关系,可以看出监督学习需要的数据信息多于非监督学习,具有更强的发现能力。有研究表明,在网络推断方面,监督学习优于非监督学习[2]。  监督学习需要利用已有的调控关系数据,通过学习调控关系的判别模型,对未知的调控关系进行判别,需要处理特征生成和分类器选择问题。miRNA与其靶基因的

5、交互特征包括自由能特征、结构序列特征和基于绑定位置特征,收集这些特征并进行计算,然后使用分类器进行模型的构建。由于支持向量机(SupportVectorMachine,SVM)在解决小样本、非线性以及高维问题中表现出的优势[3],使得它在基因网络构建方面独具一格,已成为近期的研究热点。  本文提出了一种基于粗糙集、混合粒子群和遗传算法(GeneticAlgorithm,GA)的基因调控构建方法。首先利用序列数据构建特征向量,然后使用所提方法选取最优的特征子集,构建支持向量机模型。由于存在正负样本不平

6、衡问题,本文采用SMOTE(SyntheticMinority13OversamplingTEchnique)[4]算法对样本进行处理,降低类不平衡的影响。在拟南芥和水稻数据集上的实验结果表明该方法可以得到较好的性能。  3遗传算法  遗传算法是一种模拟达尔文生物进化论的自然选择和遗传学机制演化而来的随机化搜索方法[12]。它采用概率化的寻优方法,能自动获取和指导优化的搜索空间,不需要确定的规则,能够自适应的调整搜索方向,已经被广泛应用到信号处理、组合优化和机器学习等领域。  遗传算法具有粒子群算法

7、所没有的交叉和变异操作。交叉就是按照一个较大的概率从种群中选择两个个体,交换两个个体的某个或某些位,从而形成两个新的个体。交叉操作方法有单点交叉、两点交叉、多点交叉和顺序交叉等。常用的交叉算子是单点交叉算子,是指在个体中随机设置一个交叉点,然后在该点相互交换两个配对个体的部分染色体。  变异操作是模拟生物由于偶然的因素而引起基因突变的原理来进行的。它使用一个很小的变异概率随机将染色体中的某一位或某些位使用其他值进行替换,从而形成一个新的个体。  4基于粗糙集的PSO和GA的混合算法  虽然粒子群算法

8、中粒子的学习能力很强,节省时间并且容易实现。  但是存在一些缺点:比如局部搜索能力比较差、搜索的精度不高、容易陷入局部最优解等。因此,PSO算法和其他算法的融合是当前的研究热点。Li等[13]在2006年提出将模拟退火算法和PSO进行融合;Ye等[14]在2005年将演化策略的变异算子引入到了PSO中;文献[15]在SVM特征选择方面对PSO和GA进行融合。13  本文将粒子群算法和遗传算法的交叉与变异算子进行融合。遗传算法个体之间不共享信息,侧重自然寻优,而粒子群之

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。