iosdata算法原理介绍

iosdata算法原理介绍

ID:37177127

大小:60.01 KB

页数:2页

时间:2019-05-21

iosdata算法原理介绍_第1页
iosdata算法原理介绍_第2页
资源描述:

《iosdata算法原理介绍》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ISODATA算法:(1)算法原理:ISODATA算法是在k-均值算法的基础上,增加对聚类结果的“合并”和“分裂”两个操作,并设定算法运行控制参数的一种聚类算法。IterativeSelforganizingDataAnalysisTechniquesAlgorithm迭代自组织数据分析算法l“合并”操作:当聚类结果某一类中样本数太少,或两个类间的距离太近时,进行合并。l“分裂”操作:当聚类结果某一类中样本某个特征类内方差太大,将该类进行分裂。(2)算法特点:l使用误差平方和作为基本聚类准则l设定指标参数来决定是否进行“合并”

2、或“分裂”l设定算法控制参数来决定算法的运算次数l具有自动调节最优类别数k的能力l算法规则明确,便于计算机实现(3)算法步骤:①初始化l设定控制参数:c:预期的类数;Nc:初始聚类中心个数(可以不等于c);TN:每一类中允许的最少样本数目(若少于此数,就不能单独成为一类);TE:类内各特征分量分布的相对标准差上限(大于此数就分裂);TC:两类中心间的最小距离下限(若小于此数,这两类应合并);NT:在每次迭代中最多可以进行“合并”操作的次数;NS:允许的最多迭代次数。l选定初始聚类中心②按最近邻规则将样本集{xi}中每个样本分到

3、某一类中③依据TN判断合并:如果类ωj中样本数nj

4、类内样本到类中心的标准差向量σj=(σ1j,σ2j,….,σnj)T,j=1,2,…..,Nc其各分量为:l求出每一类内标准差向量σj中的最大分量l若有某是所有样本在该特征上的标准差,同时又满足下面两个条件之一:则将该类ωj分裂为两个类,原zj取消且令Nc=Nc+1。l两个新类的中心zj+和zj-分别是在原zj中相应于的分量加上和减去,而其他分量不变,其中0<k≤1。l分裂后,Ip=Ip+1,转至②。⑦合并操作l计算各类中心间的距离Dij,i=1,2,…,Nc-1;j=1,2,…,Ncl依据TC判断合并。将Dij与TC比较,并

5、将小于TC的那些Dij按递增次序排列,取前NT个。l从最小的Dij开始,将相应的两类合并,并计算合并后的聚类中心。l在一次迭代中,某一类最多只能合并一次。lNc=Nc-已并掉的类数。⑧如果迭代次数Ip=NS或过程收敛,则算法结束。否则,Ip=Ip+1,若需要调整参数,则转至①;若不改变参数,则转至②;

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。