资源描述:
《fuzzy_c-means_clustering_algorithm_based_on_stacked_sparse_autoencoders》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1542015,51(4)ComputerEngineeringandApplications计算机工程与应用基于堆叠稀疏自编码的模糊C-均值聚类算法段宝彬1,2,韩立新2,谢进1DUANBaobin1,2,HANLixin2,XIEJin11.合肥学院数学与物理系,合肥2306012.河海大学计算机与信息学院,南京2111001.DepartmentofMathematicsandPhysics,HefeiUniversity,Hefei230601,China2.CollegeofComputer
2、andInformation,HohaiUniversity,Nanjing211100,ChinaDUANBaobin,HANLixin,XIEJin.FuzzyC-meansclusteringalgorithmbasedonstackedsparseautoencoders.ComputerEngineeringandApplications,2015,51(4):154-157.Abstract:InordertosolvethesensitivityoffuzzyC-meanscluster
3、ingalgorithmtotheoutlierandtherandomlyinitializedclusteringcenter,thestackedsparseautoencodersandtraditionalfuzzyC-meansclusteringalgorithmarecombinedtoimprovethetraditionalfuzzyC-meansclusteringalgorithm.Becausethestackedsparseautoencoderscanextractfea
4、turesoftheoriginaldatasetfromlow-leveltohigh-level,andhigh-levelfeaturescanreflectthenaturefeaturesofthesampledatatobeclusteredbetterthantheoriginaldataset,whichwillhelptoimprovetheclusteringeffectwithhigh-levelfeaturesinsteadoftheoriginaldata.Withexper
5、imentingonseveralstandarddatasetsofUCI,itisshownthattheimprovedalgorithmisfeasible.Keywords:stackedsparseautoencoders;fuzzyC-meansclustering;features;deeplearning摘要:针对模糊C-均值聚类算法对孤立点、随机初始化的聚类中心比较敏感的问题,将堆叠稀疏自编码与传统模糊C-均值聚类算法相结合,对传统模糊C-均值聚类算法进行了改进。由于堆叠稀疏自编码
6、可以提取原始数据集从低层到高层的特征,而高层的特征通常比原始数据集更能反映待聚类样本的本质特征,用其代替原始数据集进行聚类,有助于提高聚类的效果。利用改进后的算法在UCI的几个标准数据集上进行实验,结果表明改进后的算法是有效可行的。关键词:堆叠稀疏自编码;模糊C-均值聚类;特征;深度学习文献标志码:A中图分类号:TP301doi:10.3778/j.issn.1002-8331.1402-01491引言度信念神经网络[3]和深度卷积神经网络[4]等,其中堆叠近年来,一种在图像分类、语音识别、自然语言处
7、理稀疏自编码是一种最容易实现的深度学习模型。等领域获得巨大成功的机器学习技术日益受到工业界、模糊C-均值聚类(FCM)是目前应用最广泛的一种学术界的广泛关注,这就是深度学习技术。微软、谷歌、软聚类算法,它基于划分方法解决聚类问题,已成功应百度等著名高科技公司开始投入大量资金和人力用来用于数据挖掘、模式识别等领域。该算法是由Dunn[5]于支持深度学习技术的研发。深度学习通过构建含多个1973年提出的,Bezdek[6]于1981年进一步完善了该算隐层的机器学习模型,输入海量的训练数据,以学习原法。模糊
8、C-均值聚类的基本思想是首先根据给定的聚始数据更本质的特征,有助于最终提高预测或决策的正类数随机初始化聚类中心,然后采用迭代方法不断计算确率[1]。常用的深度学习模型有堆叠稀疏自编码[2]、深各样本隶属于各类别的模糊隶属度,按最大模糊隶属度基金项目:江苏省高校“青蓝工程”中青年学术带头人培养对象资助项目;安徽省自然科学基金项目(No.1208085MA15);合肥学院应用数学重点建设学科基金(No.2014xk08)。作者简介:段宝彬(1975—),男,