欢迎来到天天文库
浏览记录
ID:56059222
大小:367.92 KB
页数:7页
时间:2020-06-20
《结肠癌基因表达谱的特征选取研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第42卷第2期山东大学学报(工学版)2012年4月Vo1.42NO.2JOURNALOFSHANDONGUNIVERSITY(ENGINEERINGSCIENCE)Apr.2012文章编号:1672-3961(2012)02-0023-07DOI:10.6o4O/j.issn.1672-3961.2012.02.005结肠癌基因表达谱的特征选取研究潘冬寅,朱发,徐异,业宁(南京林业大学信息科学与技术学院,江苏南京210037)摘要:为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernof距离的浮动顺序搜索算法(sequentialfloatingsearchm
2、ethod,SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选;对筛选后的基因子集利用SFSM算法进行搜索,并以Chernof距离作为其评估函数,生成若干候选特征基因子集;利用支持向量机(supportvectormachine,SVM)、近邻(K-nearestneighbor,KNN)和径向基(radicalbasisfunction,RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernof距离发现在参数=0.25时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。关键词:特征选择;Cher
3、nof距离;浮动顺序搜索;支持向量机;近邻;径向基神经网络中图分类号:TP391.4文献标志码:AFeatureselectionofgeneexpressionprofilesofcoloncancerPANDong—yin,ZHUFa,XUSheng,YENing(CollegeofInformationTechnology,NanjingForestryUniversity,Nanjing210037,China)Abstract:Inordertoimprovetherecognitionrateofcoloncancersamplebyselectingtherelat
4、edgenes,sequentialfloatingsearchmethod(SFSM)basingonChemofdistancewasproposed.Everygenewasevaluatedandselectedbyanalyzingthedatasetofthecoloncancergeneexpressionprofiles.SomecandidatefeaturegenesubsetswereobtainedbysearchingtheselectedgenesubsetwiththemethodofSFSMwhoseevaluationfunctionwasChe
5、mofdistance.Threedifferentclassifies,supportvectormachines,K-nearestneighbors,andRBFneuralnetworks,wereusedtovalidatetheclassifiedeficiency.Theexperimentalresultsshowedthatwhen=0.25,thefeaturegenecombinationobtainedbySF—SMwithChemofdistanceasitsevaluationfunctionwasoptimal,andcoloncancersampl
6、ecouldberecognizedbest.Keywords:featureselection;Chemofdistance;sequentialfloatingsearchmethod(SFSM);supportvectormachine(SVM);K-nearestneighbor();radicalbasisfunctionneuralnetwork(RBFNN)0引言随着基因芯片技术的发展及生物信息学研究的深入,人类各种组织的基因表达已经获得,根据这些数据采用模式识别及数据挖掘技术对基因表达数据进行分析,从而进行肿瘤判断,是当今生物信息学的一个重要研究方向。如何以最少的
7、特征基因准确建立肿瘤类别识别模型,同时提高分类能力更是研究重点。这是模式识别中的特征选择问题,即如何选择最小的特征子集来表示原数据集,很多学者对特征选择问题做了深入研究,有些方法已经运用到了特征基因的选择上。DUANKaibo和RAJAPAKSEJc将SVM—RFE收稿日期:201I-04.15基金项目:国家自然科学基金资助项目(30671639);江苏省自然科学基金资助项目(BK2009393);江苏省青蓝工程学术带头人资助项目;江苏省科技创新工程资助项目(CXLX11—052
此文档下载收益归作者所有