基于遗传优化获取微阵列最佳分类规则

基于遗传优化获取微阵列最佳分类规则

ID:21878182

大小:60.00 KB

页数:8页

时间:2018-10-25

基于遗传优化获取微阵列最佳分类规则_第1页
基于遗传优化获取微阵列最佳分类规则_第2页
基于遗传优化获取微阵列最佳分类规则_第3页
基于遗传优化获取微阵列最佳分类规则_第4页
基于遗传优化获取微阵列最佳分类规则_第5页
资源描述:

《基于遗传优化获取微阵列最佳分类规则》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于遗传优化获取微阵列最佳分类规则遗传编程(GP)提出一种最优规则遗传算法(BRGA)对分类规则进行优化的方法,获取最佳分类规则集,此算法可以调整分类器模型的相关参数,在适当增加迭代基础上大幅提高分类的精确度,具有相当的灵活性和可理解性.利用6个基因数据集检验了算法的性能.仿真结果表明,本文提出的算法与其他文献的方法相比,在具有较高分类精确度和稳定性前提下大幅降低了计算复杂度及冗余.    关键词:最优规则遗传算法;微阵列;遗传编程;分类规则;计算复杂度  :TP391:A  生物医学研究表明,人类大多数疾

2、病的发病机制,比如癌症,从根本上来说都和基因息息相关.微阵列数据是将样本实验形成的影像转为基因表达矩阵,矩阵行表示基因,列表示类别样本,矩阵中的元素描述不同基因在不同样本的表达水平.  由于微阵列芯片技术[1]获得的基因数据数量远大于样本数量,随着维数的增加,最大的障碍则是在高维特征空间运算时存在的“维数灾难”.微阵列大量基因数据仅为样本分类提供了少数有分类意义的、具有明显特征的基因.因此,在样本分类之前,选择特征基因是至关重要的,这直接影响到之后生成的分类器性能.微阵列分类作为生物指标的探索成为生物信

3、息学一个重要的课题,事实上,由于存在更多的癌症类型和潜在的癌症子类,如果展开肿瘤分类问题到多重肿瘤类别,数据集包含更多的类别和非常少量的样本,问题将变得更具有挑战性.  一些研究报告指出,在基因选择部分使用遗传算法能改进微阵列数据的分类性能[1-2],因此,遗传算法已广泛用于解决包括数据分类的各种难题[3-4].本文提出一种最优规则遗传算法(BestRuleGeicAlgorithm,BRGA),选用一种基于遗传优化的分类算法生成分类规则,用二进制向量表示分类规则,初始化规则集,设定相应的适应度及

4、初始种群的规模,通过变异产生一定数量的最优分类规则.通过实验,使用6个基因表达数据集来验证算法的性能.  微阵列数据分类技术通常包含2部分内容:1)基因选择;2)构建分类器模型.文献[5]在基因选择部分使用排列值计分RBS算法,很好地解释了基因之间的相关性,大幅降低基因矩阵维度,在一定程度上减少了计算复杂性;在构建分类器部分提出了LCR方法,可以用很少的基因构造形成分类规则,提高了算法的可理解性.但分类规则的形成过程仍存在很多不足,如分类器模型中规则形成框架过于缜密,容易导致过拟合,产生庞大规则集的迭代过程相

5、当繁琐,并产生大量冗余的规则,导致计算复杂度较高且算法收敛速度较低.分类器的构建则是整个技术的核心所在,传统的微阵列分类方法有:加权投票()[8],费舍尔线性判别分析(LDA)[9],人工神经X络(ANN)[10],遗传规划(GP)[11],最小二乘逻辑回归[12]和朴素贝叶斯方法[13]等.由于它们仅仅聚焦于分类性能,而不能进一步提供任何医学和生物学依据,导致这些分类算法往往产生僵硬的分类系统,存在稳定性弱和开销大的特征,缺乏可扩展性.决策树算法[14]和随机森林算法

6、[15]基于决策规则产生分类器模型,此类算法获得的分类规则在某种意义上包含了生物体基因之间的相关性,但如果训练样本存在小的差异会导致决策树结构产生大的变化,致使分类器缺乏稳定性,这些分类方法仍然存在很大的局限性.  1BRGA方法的基本思想  BRGA算法是在遗传优化的基础上,将分类规则集作为种群,使用二进制串表示其中任意一条分类规则,计算对应于基因属性的比较关系的分类规则适应度值,经过若干代的繁殖过程,包括选择、交叉和变异运算,反复迭代优化,获取具有较高适应度的最佳分类规则.  4结论  本文提出的

7、BRGA算法很好地解决了用微阵列基因表达值构建分类决策规则普遍速度慢的难题,通过调整适合规则的适应度值及相关参数对初始规则集进行优化,该算法能很快收敛于最优分类规则集.采用6个数据集验证了该算法的性能,实验结果表明,BRGA算法具有较高的精确度和极少的分类运算耗时(CPUtime).当然,由于实验条件和生物学发展的局限性,该算法有待进一步提高和完善.  遗传编程(GP)提出一种最优规则遗传算法(BRGA)对分类规则进行优化的方法,获取最佳分类规则集,此算法可以调整分类器模型的相关参数,在适当增加迭代基础上大

8、幅提高分类的精确度,具有相当的灵活性和可理解性.利用6个基因数据集检验了算法的性能.仿真结果表明,本文提出的算法与其他文献的方法相比,在具有较高分类精确度和稳定性前提下大幅降低了计算复杂度及冗余.    关键词:最优规则遗传算法;微阵列;遗传编程;分类规则;计算复杂度  :TP391:A  生物医学研究表明,人类大多数疾病的发病机制,比如癌症,从根本上来说都和基因息息相关.微阵列数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。