模糊聚类在特征选取中的应用.pdf

模糊聚类在特征选取中的应用.pdf

ID:52058638

大小:464.09 KB

页数:7页

时间:2020-03-22

模糊聚类在特征选取中的应用.pdf_第1页
模糊聚类在特征选取中的应用.pdf_第2页
模糊聚类在特征选取中的应用.pdf_第3页
模糊聚类在特征选取中的应用.pdf_第4页
模糊聚类在特征选取中的应用.pdf_第5页
资源描述:

《模糊聚类在特征选取中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第44卷第6期2012年12月南京航空航天大学学报JournalofNanjingUniversityofAeronautics&Astronautics模糊聚类在特征选取中的应用刘全金1’2赵志敏1李颖新V01.44No.6Dec.2012(1-南京航空航天大学理学院,南京,210016;2.安庆师范学院物理与电气工程学院,安庆,246011;3.北京经纬纺机新技术有限公司机器视觉与智能研究所,北京,100176)摘要:提出了一种基于模糊聚类算法的高维特征选取方法。首先,利用Bhattacharyya距离过滤样本类别无关的特征;然后,基于递归特征别除过程,提出了基于模糊迭代自组织数据分析技术

2、(Interactiveself—organizingdataanalysistechnique,ISODATA)聚类方法,以样本与聚类中心的加权距离作为可分性指标,产生候选特征子集;最后,以候选特征子集分类和聚类的接受者操作特征曲线下面积(Areaunderthereceiveroperatingcharacteristiccurve,AUC)值和正确率作为目标函数,确定最佳特征子集。将该方法用于选取5个基因表达谱数据集的特征基因,结果显示该方法所选特征具有较好的分类和聚类能力,说明了提出的特征选取方法的有效性。关键词:特征选取}模糊迭代自组织数捂分析技术;层次聚类;支持向量机;K近邻中圈分

3、类号:TP391;Q812文献标识码;A文章编号:1005—2615(2012)06—0881—07ApplicationofFuzzyClusteringAlgorithmonFeatureSelectionLiuQuanjinl“,ZhaoZhiminl,LiYingxin3(1.CollegeofScience,NanjingUniversityofAeronautics&Astronautics,Nanjing,210016,China;2.SchoolofPhysicsandElectronic,AnQingNormalUniversity,Anqing,246011,China;3

4、.InstituteofMachineVisionandMachineIntelligence,BeijingJingweiTextileMachineryNewTechnologyCo.,Ltd.,Beijing,100176,China)Abstract:Anewfeatureselectionmethodbasedonclusteringalgorithmisproposedtoselecteinforma~tirefeatures.First,category—unrelatedfeaturesarekickedoutaccordingtOBhattacharyyadistance.T

5、hen,basedontheprocessofrecursivefeatureelimination,flweighteddistancebetweensampleandtheclustercentergeneratedbythefuzzyinteractiveself—organizingdataalgorithm(ISODATA)isusedastheindexoffeatureforseparatingdifferentclasses.Finally,thecandidatefeaturesubsetwiththemaxi—mumareaunderthereceiveroperating

6、characteristiccurve(AUC)valueandaccuracyratebothinclassi~ficationandclusteringtestsisselectedastheoptimalfeaturesubset.Theproposedfeaturesubsetselec~tionmethodisappliedtofivegeneexpressionprofiledatasetsandexperimentresultsshowthatthese—lectedfeatureshavegoodperformanceintermsofbothclassificationand

7、clusteringmeasurements.Re—sultsdemonstratethattheproposedmethodiseffectiveforselectinginformativefeaturesfromhigh—·di—.mensionaldataset.Keywords:featureselection;fuzzyiteractiveself—organizingdataanal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。