资源描述:
《基于dna微阵列数据的特征子空间集成分类》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第41卷第4期吉林大学学报(工学版)Vol.41No.42011年7月JournalofJilinUniversity(EngineeringandTechnologyEdition)July2011基于DNA微阵列数据的特征子空间集成分类1,21111于化龙,顾国昌,赵靖,刘海波,沈晶(1.哈尔滨工程大学计算机科学与技术学院,哈尔滨150001;2.江苏科技大学,计算机科学与工程学院,江苏镇江,212003)摘要:针对DNA微阵列数据应用于临床诊断时分类准确率过低的问题,结合其高维小样本的特点提出了一
2、种特征子空间集成分类方法。该方法首先通过层次聚类与信噪比特征选择策略将原始训练数据集映射到一个非冗余的特征基因空间,然后随机抽取一些特征子空间构成训练子集并应用支持向量机训练基分类器,最后采用多数投票的方式决定测试样本的类属。最后在4个标准的微阵列数据集上与其他方法进行了对比实验,结果证明了本文方法的有效性。关键词:计算机应用;集成分类;特征子空间;DNA微阵列数据;支持向量机中图分类号:TP391;TP181文献标志码:A文章编号:1671-5497(2011)04-1071-06Featuresubspa
3、ceensembleclassificationbasedonDNAmicroarraydata1,21111YUHua-long,GUGuo-chang,ZHAOJing,LIUHa-ibo,SHENJing(1.CollegeofComputerScienceandTechnology,HarbinEngineeringUniversity,Harbin150001,China;2.SchoolofComputerScienceandEngineering,JiangsuUniversityofSciencean
4、dTechnology,Zhenjiang212003,China)Abstract:Lowclassificationaccuracyisoneofthemajorrestrictionstotheuseofmicroarraydatainclinicaldiagnosis.Tosolvethisproblem,bytakingconsiderationofthecharacteristicsofhigh-dimensionandsmallsampleofDNAmicroarraydataset,anovelcla
5、ssificationapproachwasproposed,whichisnamedfeaturesubspaceensembleclassification.Inthisapproach,first,hierarchicalclusteringandsigna-lnoiseratiofeatureselectionstrategywereusedtoprojectthetrainingdatasetfromoriginalspacetoanon-redundantfeaturegenespace.Then,mas
6、sfeaturesubspaceswereextractedtoconstructtrainingsubsets,andsupportvectormachinewasusedtotrainbaseclassifiers.Finally,themajorityvotingstrategywasappliedtoclassifythetestingsamples.Theeffectivenessandfeasibilityoftheproposedapproachwasverifiedonfourbenchmarkmic
7、roarraydatasets.Experimentresultsshowthatbetterclassificationperformancecanbeobtainedbytheproposedapproachthanmajorityofthecurrentensembleclassificationapproachesonmicroarraydata.Keywords:computerapplication;ensembleclassification;featuresubspace;DNAmicroarrayd
8、ata;supportvectormachine收稿日期:2009-11-14.基金项目:国家自然科学基金项目(60873036);中国博士后科学基金项目(20060400809);黑龙江省青年科学技术专项基金项目(QC06C022);中央高校基本科研业务费专项项目(HEUCF100601,HEUCFT1007).作者简介:于化龙(1982-)