结肠癌基因表达谱的特征选取研究.pdf

结肠癌基因表达谱的特征选取研究.pdf

ID:56059222

大小:367.92 KB

页数:7页

时间:2020-06-20

结肠癌基因表达谱的特征选取研究.pdf_第1页
结肠癌基因表达谱的特征选取研究.pdf_第2页
结肠癌基因表达谱的特征选取研究.pdf_第3页
结肠癌基因表达谱的特征选取研究.pdf_第4页
结肠癌基因表达谱的特征选取研究.pdf_第5页
资源描述:

《结肠癌基因表达谱的特征选取研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第42卷第2期山东大学学报(工学版)2012年4月Vo1.42NO.2JOURNALOFSHANDONGUNIVERSITY(ENGINEERINGSCIENCE)Apr.2012文章编号:1672-3961(2012)02-0023-07DOI:10.6o4O/j.issn.1672-3961.2012.02.005结肠癌基因表达谱的特征选取研究潘冬寅,朱发,徐异,业宁(南京林业大学信息科学与技术学院,江苏南京210037)摘要:为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernof距离的浮动顺序搜索算法(sequentialfloatingsearchm

2、ethod,SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选;对筛选后的基因子集利用SFSM算法进行搜索,并以Chernof距离作为其评估函数,生成若干候选特征基因子集;利用支持向量机(supportvectormachine,SVM)、近邻(K-nearestneighbor,KNN)和径向基(radicalbasisfunction,RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernof距离发现在参数=0.25时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。关键词:特征选择;Cher

3、nof距离;浮动顺序搜索;支持向量机;近邻;径向基神经网络中图分类号:TP391.4文献标志码:AFeatureselectionofgeneexpressionprofilesofcoloncancerPANDong—yin,ZHUFa,XUSheng,YENing(CollegeofInformationTechnology,NanjingForestryUniversity,Nanjing210037,China)Abstract:Inordertoimprovetherecognitionrateofcoloncancersamplebyselectingtherelat

4、edgenes,sequentialfloatingsearchmethod(SFSM)basingonChemofdistancewasproposed.Everygenewasevaluatedandselectedbyanalyzingthedatasetofthecoloncancergeneexpressionprofiles.SomecandidatefeaturegenesubsetswereobtainedbysearchingtheselectedgenesubsetwiththemethodofSFSMwhoseevaluationfunctionwasChe

5、mofdistance.Threedifferentclassifies,supportvectormachines,K-nearestneighbors,andRBFneuralnetworks,wereusedtovalidatetheclassifiedeficiency.Theexperimentalresultsshowedthatwhen=0.25,thefeaturegenecombinationobtainedbySF—SMwithChemofdistanceasitsevaluationfunctionwasoptimal,andcoloncancersampl

6、ecouldberecognizedbest.Keywords:featureselection;Chemofdistance;sequentialfloatingsearchmethod(SFSM);supportvectormachine(SVM);K-nearestneighbor();radicalbasisfunctionneuralnetwork(RBFNN)0引言随着基因芯片技术的发展及生物信息学研究的深入,人类各种组织的基因表达已经获得,根据这些数据采用模式识别及数据挖掘技术对基因表达数据进行分析,从而进行肿瘤判断,是当今生物信息学的一个重要研究方向。如何以最少的

7、特征基因准确建立肿瘤类别识别模型,同时提高分类能力更是研究重点。这是模式识别中的特征选择问题,即如何选择最小的特征子集来表示原数据集,很多学者对特征选择问题做了深入研究,有些方法已经运用到了特征基因的选择上。DUANKaibo和RAJAPAKSEJc将SVM—RFE收稿日期:201I-04.15基金项目:国家自然科学基金资助项目(30671639);江苏省自然科学基金资助项目(BK2009393);江苏省青蓝工程学术带头人资助项目;江苏省科技创新工程资助项目(CXLX11—052

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。