欢迎来到天天文库
浏览记录
ID:53028274
大小:310.83 KB
页数:5页
时间:2020-04-14
《基于BQPSO算法的癌症特征基因选择与分类-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第14卷第1期江南大学学报(自然科学版)Vo1.14No.12015年2月JournalofJiangnanUniversity(NaturalScienceEdition)Feb.2015基于BQPSO算法的癌症特征基因选择与分类范方云,孙俊(江南大学物联网工程学院,江苏无锡214122)摘要:提出了基于二进制编码的量子行为粒子群优化算法(BQPSO)的癌症特征基因选择方法,利用BQPSO对样本数据进行特征选择。使用选出的特征基因训练支持向量机进行留一法交叉验证。实验结果表明,基于BQPSO算法
2、的癌症特征基因选择方法是一种行之有效的方法。关键词:微阵列数据;特征基因;二进制编码的量子行为粒子群优化算法;支持向量机;留一法交叉验证中图分类号:TP181文献标志码:A文章编号:1671—7147(2015)O1—0011—05CancerFeatureGeneSelectionandClassificationBasedonBQPSOAlgorithmFANFangyun,SUNJun(SchoolofInternetofThingsEngineering,JiangnanUniversit
3、y,Wuxi214122,China)Abstract:Inthispaper,thecancerfeaturegeneselectionmethodbasedonBQPSO(Quantum—BehavedParticleSwarmOptimizationwithBinaryEncoding)isproposedwhereBQPSOalgorithmisappliedtoselectfeaturegenesfromexampledataandfeaturegenesselectedareusedt
4、otrainSVMclassifiersandtomakeLOOCV(1eave—one·outcross—validation).TheexperimentresultsshowthatthecancerfeatureselectionmethodbasedontheBQPSOalgorithmiseffective.Keywords:microarraydata,featuregene,BQPSO,SVM,LOOCV现代社会,癌症已经成为威胁人类生命的重要作用的特征基因。因素之一。漏诊和误诊使
5、很多患者错过了最佳治疗目前常用的特征选择方法可以从两方面进行时机。因此,人们迫切需要更多可靠的辅助方法,结分类¨J,即评价准则和搜索策略。在基于评价准则合医疗诊断,最大限度地提高癌症诊断的正确率。划分的特征选择方法中,又可根据特征选择是否独随着信息科学和分子生物科学的飞速发展,基因芯立于后续的学习算法分为过滤式(Filter)和封装式片技术因其微型化,高通量等特点为人们提供了大(Wrapper)两种。Filter与后续学习算法无关,而量的微阵列DNA表达数据,被广泛应用于癌症诊Wrapper利用后
6、续学习算法的训练准确率评估特征断、临床检验等方面。然而,DNA微阵列数据维度子集。在基于搜索策略划分特征选择方法时,按照高,样本量很少,且分布不均匀。过多的分类特征不特征子集的形成过程,可分为全局搜索,随机搜索一定能够得到较好的分类结果,而且增加了计算复和启发式搜索3种。一个具体的搜索算法会采用两杂度。为此,在利用DNA微阵列表达数据进行癌症种或多种基本搜索策略¨2j。张靖等5利用信噪比分类之前必须进行特征选择,选择出对分类有积极指标过滤无关基因,再采用迭代Lasso方法进行冗收稿日期:2014—
7、08—15;修订日期:2014—10—16。基金项目:国家自然科学基金项目(61170119)。作者简介:范方云(1989一),女,江苏扬州人,计算机科学与技术专业硕士研究生。通信作者:孙俊(197l一),男,江苏无锡人,副教授,硕士生导师。主要从事智能计算、图像处理与模式识别等研究。Email:sunjun_wx@hotmail.corn12江南大学学报(自然科学版)第14卷余基因的剔除,结合SVM分类器在数据集Leukemia,Prostate,colon上分别获得了98.61%,96.08%
8、,90.32%的分类正确率。张焕萍等提出了离散粒子群和支持向量机封装模式的BPSO.SVM特征基因选择方法,在数据集colon上用34个特征基因子集获得了89.67%的平均正确率。目前结合多种特征选择方法虽比单独使用有一定改善,但存在的问题依然很明显,如第二阶段的缠绕过程如何在特征子集规模、所选特征的分类能力和其他约束条件等多个目标下求得最优解。文中提出的基于BQPSO的癌症特征基因选择方法属于全局搜索和启发式搜索的结合,依靠改变BQPSO的初始搜索空间的大小和BQPSO的强搜索能
此文档下载收益归作者所有