资源描述:
《聚类分析及其在图像处理上的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、.聚类分析及其在图像处理上的应用..1绪论1.1基于聚类的图像处理的研究现状聚类分析在图像处理中应用广泛,其中一项重要的应用就是图像分割。图像分割多年来一直受到人们的高度重视,各种类型的分割算法相继被提出。虽然人们在图像分割方面做了许多工作,但是至今仍没有通用的分割算法,也不存在一个客观的评价准则。大多数分割算法都是针对一种具体类型的图像提出的很难适用于所有图像。实际上由于各个领域的图像千差万别,也很难提出万能的分割算法。基于聚类的图像分割方法是图像分割领域中一类非常重要且应用广泛的算法。2聚类分析概述2.1聚类
2、的定义聚类的目的是将有限个无标注数据划分到有限个离散的组或类中,发现数据隐藏的内部结构。Backer和Jain[1]指出数据的划分是依赖于所选择的相似性度量的,通过主观地选择相似性度量来达到有的的划分。至今,人们并没有对聚类给出一个统一的定义。多数研究者都是从内部同质性和外部可分性对聚类簇进行描述,即同类内数据对象间应该彼此相似,不同类间的数据对象应该不相似[3。在给出聚类的数学描述之前,首先介绍与聚类有关的一辟术语和数学表达方法。样本:指要进行聚类的数据集中的单个数据。样本一般是一个多维向量,向量的每个分量可以
3、是数值型或者名词型的数据,一般称为特征或者属性。样本集:或称数据集,是由单个样本所组成的集合,即是需要聚类操作的数据整体,通常表示为一个矩阵。相异度矩阵:该矩阵中的每个元素表$样本集中的每对样本之间的相异程度,一般是非负值。相似度矩阵:该矩阵中的每个元素表小?样本集中的每对样本之间的相似程度,一般是非负值。类:或称簇,指通过聚类而形成的一组,同一类中的样本具有相似的特征。通常用C或K表示类的个数。类原型:能够代表某个类性质的数据兀,可以是某类样本中的一个样本,..或者是某类样本的一个加权值,也可以是能描述一个类特
4、征的向量。划分矩阵[U]n*K:矩阵中的每个元素表示每个样本属于各个类的模糊隶属度,且,在此〖表?样本标号,k表类标标号。1.2聚类的数据类型通常获得的数据类型有两种:一是数据矩阵,二是相异度矩阵(相似度矩阵)。假定数据集中有n个样本:,i=1,2,....,n,每个样本有p个变量(特征属性),则这n个样本可表示成n*p(n个样本xp个变量)的数据矩阵。(2-1)其中每个对象对应为一个p维向量:(2-2)相异度矩阵存储的是n个样本两两之问的相界度,表现形式足一个n*n维的矩阵。(2-3)在这里d(i,j)是样本i
5、和样本j之间相异性的量化表示,通常是一个非负的数值,当样本i和样本j越相似,d(i,j)的值就越接近0;反之,两个样本越不相似,的值就越大。d(i,j)=d(j,i),且d(i,j)=0,因此得到形如(2-3)的矩阵。图像数据的表示日常应用中得到的图像一般分为两类:灰度图像和彩色图像。灰度图像的数值表示为一个二维矩阵[I]m*n图像一共包含m*n个像素。在此,m和n分别代表图像的高和宽,(ij)表示位于第i行和第j列的像素,Iij表示其灰度值。彩色图像的数值表示为一个三维矩阵[I]m*n*3,像素的个数仍为m×n
6、,3表示三个颜色通道,每一层的二维矩阵表示该图像在某一个颜色通道的数值。位于位置(i,j)的像素对应的..颜色特征向量表示为[I(i,j,1),I(i,j,2),I(i,j,3)]。在许多情况下,色彩是描述一幅图像最简单有效的特征,而且人眼对色彩的分辨率大大高于对灰度图像的分辨率,因此彩色图像所携带的信息远远大于灰度图像。一般的图像处理技术最先应用于灰度图像,然后发展到彩色图像,图像分割也不列外。颜色特征可以来自于不同的颜色空间,不同的颜色空间以不同的方式对图像颜色进行描述。一共有四种不同的颜色空间:RGB颜色空
7、间、XYZ颜色空间、HIS颜色空间、Lab颜色空间。RGB颜色空间是基本的颜色空间,RGB对应于红(R)、绿(G)、蓝(B)三种基色,其余所有颜色空间都可由RGB颜色空间经过线性或非线性变换得出的。给定一幅待分割的图像,我们可以直接获得像素的位置信息,灰度值(灰度图像)或者RGB颜色特征值(彩色图像),这些特征也是图像分割中最常用的特征属性。但是对于一些复杂图像,单纯依赖这些底层特征不能得到满意的分割结果。基于这些底层特征,人们提取了更多有效的特征,其中常用的有描述物体表面灰度变化的纹理特征和根据特定对象的先验信
8、息加入的形状特征。最近,人们开始借助一辟先进的电子产品提取深度信息,通过加入这辟高层特征来改善对特定类图像的分割结果。在提取特征之后,就可以得到每个像素点的一个向量表小,也就可以看成是高维空间中的一个数据点。但是,像素点又和传统的数据不同,每个像素点在阁像中的位置是固定的,每个像素点的邻域像素点都可以直接通过位置信息获得,这一特性也在图像数据的相似度计算上得以体现。2.3