资源描述:
《聚类分析(我)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据处理的内容:一、数据预处理1、数据标准化处理。2、数据光滑化处理。二、数据分类•…聚类分析。三、主要影响因索的提取■…主成分分析。四、数据具体分析1、回归分析。2、相关性分析。(-)处理数据时我们通常先将数据标准化数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。(1)数据标准化1.中心化变换*xij=Xij(i=123,…畀;)=123,…,卩)Xq-min(xy)儿訂一"R:2.极差规格化变换S磯少)—豐叭"VQ=1,2,3,・•・/;)=1,2,3,…,p)3.标准化变换(z-score)标准化*Xji—*j1xu=S.=——f(x.-X.)2(i=1,2,3,
2、…,n;j=1,2,3,…,p)刁7n-1/=1774•对数变换x;=log(X/;/.)(2)、数据光滑化处理lz、1、移动平均法"A=0"^)Xji+b尹2、指数平滑法其中xk为原始数据,Yk为平滑后的数据,n为数据个数,b为平滑权数。一系统聚类方法1、最短距离法用matbb做题见系统聚类分析法最小距离法.m是穆老师给的ppt中的例子的求法2、最长距离法3、中间距离法4、类平均法5、可变类平均法6、离差平方和法7、可变方法8、重心法二动态聚类动态聚类步骤为:第一,选择若干个观测值点为“凝聚点”;第二,可选择地,通过分配每个“凝聚点”最近的类里来形成临时分类。每一次对一个观测值点
3、进行归类,“凝聚点”更新为这一类目前的均值;第三,可选择地,通过分配每个“凝聚丿屮最近的类里来形成临时分类。所有的观测值点分配完后,这些类的“凝聚点”用临时类的均值代替。该步骤町以一直进行直到“凝聚点"的改变很小或为零时止;第四,最终的分类有分配每一个观测到最近的“凝聚点”而形成。三其他聚类法两维图论聚方类模糊聚类0-1变量聚类二阶段聚类K均值聚类法分为如下儿个步骤:一、初始化聚类屮心1、根据具体问题,凭经验从样本集中选出C个比较合适的样本作为初始聚类中心。2、用前C个样木作为初始聚类屮心。3、将全部样本随机地分成C类,计算每类的样本均值,将样本均值作为初始聚类屮心。二、初始聚类1
4、、按就近原则将样本归入各聚类中心所代表的类中。2、取一样本,将其归入与其最近的聚类屮心的那一类屮,重新计算样本均值,更新聚类中心。然后取卜•一样本,重复操作,直至所有样本归入相应类中。三、判断聚类是否合理采用误差平方和准则函数判断聚类是否合理,不合理则修改分类。循环进行判断、修改直至达到算法终止条件。clcclearticRGB二imread('test5.jpg');%读入像img=rgb2gray(RGB);[m,n]=sizc(img);subplot(2,2,1),imshow(img);titleC图一原图像')subplot(2,2,2),imhist(img);tit
5、le(,图二原图像的灰度直方图')holdoff;img=double(img);fori=l:200cl(l)=25;c2(l)=125;c3(l)二200;%选择三个初始聚类屮心r=abs(img-cl(i));g=abs(img-c2(i));b=abs(img-c3(i));%计算各像素灰度与聚类屮心的距离r_g=r-g;g_b二g-b;r_b=r-b;n_r=find(r_g<=0&r_b<=0);%寻找最小的聚类中心n_g=find(r_g>0&g_b<=0);%寻找中间的一个聚类中心n_b=find(g_b>0&r_b>0);%寻找最大的聚类屮心i=i+l;c1(i)
6、=sum(img(n_r))/length(n_r);%将所有低灰度求和取平均,作为下一个低灰度中心c2(i)=sum(img(n_g))/length(n_g);%将所有低灰度求和取平均,作为卜'一个屮间灰度屮心c3(i)=sum(img(n_b))/length(n_b);%将所有低灰度求和取平均,作为下一个高灰度屮心dl(i)=abs(cl(i)-cl(iT));d2(i)二abs(c2(i)-c2(iT));d3(i)=abs(c3(i)-c3(i~l));ifdl(i)<=0.001&&d2(i)<=0.001&&d3(i)<=0.001R二cl(i);G=c2(i);B
7、=c3(i);k二i;break;endendRGBimg=uint8(img);img(find(imgR&imgG))二255;toesubplot(2,2,3),imshow(img);title图三聚类后的图像')subplot(2,2,4),imhist(img);title('图四聚类后的图像直方图')感觉matlab这个软件好使,能处理各个方面的算法仿真。开始做MP2音频