欢迎来到天天文库
浏览记录
ID:37177127
大小:60.01 KB
页数:2页
时间:2019-05-21
《iosdata算法原理介绍》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ISODATA算法:(1)算法原理:ISODATA算法是在k-均值算法的基础上,增加对聚类结果的“合并”和“分裂”两个操作,并设定算法运行控制参数的一种聚类算法。IterativeSelforganizingDataAnalysisTechniquesAlgorithm迭代自组织数据分析算法l“合并”操作:当聚类结果某一类中样本数太少,或两个类间的距离太近时,进行合并。l“分裂”操作:当聚类结果某一类中样本某个特征类内方差太大,将该类进行分裂。(2)算法特点:l使用误差平方和作为基本聚类准则l设定指标参数来决定是否进行“合并”
2、或“分裂”l设定算法控制参数来决定算法的运算次数l具有自动调节最优类别数k的能力l算法规则明确,便于计算机实现(3)算法步骤:①初始化l设定控制参数:c:预期的类数;Nc:初始聚类中心个数(可以不等于c);TN:每一类中允许的最少样本数目(若少于此数,就不能单独成为一类);TE:类内各特征分量分布的相对标准差上限(大于此数就分裂);TC:两类中心间的最小距离下限(若小于此数,这两类应合并);NT:在每次迭代中最多可以进行“合并”操作的次数;NS:允许的最多迭代次数。l选定初始聚类中心②按最近邻规则将样本集{xi}中每个样本分到
3、某一类中③依据TN判断合并:如果类ωj中样本数nj4、类内样本到类中心的标准差向量σj=(σ1j,σ2j,….,σnj)T,j=1,2,…..,Nc其各分量为:l求出每一类内标准差向量σj中的最大分量l若有某是所有样本在该特征上的标准差,同时又满足下面两个条件之一:则将该类ωj分裂为两个类,原zj取消且令Nc=Nc+1。l两个新类的中心zj+和zj-分别是在原zj中相应于的分量加上和减去,而其他分量不变,其中0<k≤1。l分裂后,Ip=Ip+1,转至②。⑦合并操作l计算各类中心间的距离Dij,i=1,2,…,Nc-1;j=1,2,…,Ncl依据TC判断合并。将Dij与TC比较,并5、将小于TC的那些Dij按递增次序排列,取前NT个。l从最小的Dij开始,将相应的两类合并,并计算合并后的聚类中心。l在一次迭代中,某一类最多只能合并一次。lNc=Nc-已并掉的类数。⑧如果迭代次数Ip=NS或过程收敛,则算法结束。否则,Ip=Ip+1,若需要调整参数,则转至①;若不改变参数,则转至②;
4、类内样本到类中心的标准差向量σj=(σ1j,σ2j,….,σnj)T,j=1,2,…..,Nc其各分量为:l求出每一类内标准差向量σj中的最大分量l若有某是所有样本在该特征上的标准差,同时又满足下面两个条件之一:则将该类ωj分裂为两个类,原zj取消且令Nc=Nc+1。l两个新类的中心zj+和zj-分别是在原zj中相应于的分量加上和减去,而其他分量不变,其中0<k≤1。l分裂后,Ip=Ip+1,转至②。⑦合并操作l计算各类中心间的距离Dij,i=1,2,…,Nc-1;j=1,2,…,Ncl依据TC判断合并。将Dij与TC比较,并
5、将小于TC的那些Dij按递增次序排列,取前NT个。l从最小的Dij开始,将相应的两类合并,并计算合并后的聚类中心。l在一次迭代中,某一类最多只能合并一次。lNc=Nc-已并掉的类数。⑧如果迭代次数Ip=NS或过程收敛,则算法结束。否则,Ip=Ip+1,若需要调整参数,则转至①;若不改变参数,则转至②;
此文档下载收益归作者所有