资源描述:
《模糊数学在数据挖掘中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、模糊数学在数据挖掘中的应用研究(中国石油大学(华东)计算机与通信工程学院)一、模糊数学基本概念1.模糊集(Fuzzyset)定义1设X是论域,称映射A:X→[0,1]为X上的模糊集合(Fuzzyset)简称F集,记为A。称A(x)为元素x相对于F集的隶属度。称A(·)为F集A的隶属函数。(1)模糊集合的表示:,称为元素属于模糊集的隶属度;则模糊集可以表示为:,或,。(2)模糊集合的运算:,,并集:,交集:,补集:,包含:。2.幂集定义2称论域X上的F集的全体集合为X上的F-幂集。3.模糊集的-截集定义3已知U上模糊子集对,则称为模糊集的-截集;称为模糊集的-
2、强截集;称为、的置信水平或阈值。4.三角范数、反三角范数-15-定义4称二元函数T:[0,1]*[0,1]à[0,1]为三角模或三角范数,简称T-范数,满足以下条件:若a,b,c,d∈[0,1],有:交换律:T(a,b)=T(b,a)结合律:T(T(a,b),c)=T(a,T(b,c))单调性:a≤c,b≤d时,T(a,b)≤T(c,d)边界条件:T(a,1)=a,T(0,a)=0定义5称二元函数S:[0,1]*[0,1]à[0,1]为反三角范数,简称S-范数,满足以下条件:若a,b,c,d∈[0,1],有:交换律:S(a,b)=S(b,a)结合律:S(S(
3、a,b),c)=S(a,S(b,c))单调性:a≤c,b≤d时,S(a,b)≤S(c,d)边界条件:S(a,1)=1,S(0,a)=a注:三角范数T与反三角范数S关于余运算c对偶二、模糊数学的基本定理1.模糊截积定义6已知U上模糊子集,对,也是U上模糊集,其隶属函数为:;称为为与的模糊截积。2.分解定理1已知模糊子集,则。推论1:对。3.分解定理2已知模糊子集,则。推论2:对。三、模糊关系1.模糊关系与模糊关系的合成(1)模糊关系-15-定义7从U到V上的一个模糊关系:,表示具有的关系程度,。(满足01)称为U到V上的一个模糊关系的模糊矩阵。模糊关系性质:∀
4、x∈U,有μR(x,x)=0,则R满足反自反性;∀x,y∈U,x≠y,有μR(x,y)=μR(y,x),则R具有对称性;∀x,y∈U,有μR(x,y)=μR(y,x)=0,则R具有反对称性;∀(x,y),(x,z),(y,z)∈U×V,有μR(x,z)≥∨(μR(x,y)∧μR(y,z)),则R满足传递性。1)F相似关系:设R是论域U×V上的模糊关系,若R满足自反性和对称性,称R为模糊相似关系。2)F等价关系:若R满足自反性、对称性和传递性,称R为模糊等价关系。(2)F集的内积与外积定义8设论域为X,A,BF(X),称为F集A与B的内积;称为F集A与B的外积
5、。(3)格贴近度定义9设论域为X,A,BF(X),称(A·B)()∧()为格贴近度。2.模糊等价矩阵及其矩阵定义10设方阵为以模糊矩阵,若满足=则称为模糊等价矩阵。模糊等价矩阵可以反映模糊分类关系的传递性,即描述诸如“甲像乙,乙像丙,则甲像丙”这样的关系。设=为一个模糊等价阵,01为一个给定的数,令则称矩阵为的截阵。-15-例如,=为一个模糊等价阵,取0.4<,则=;若取,则=。四、模糊聚类分析模糊划分的概念最早由Ruspini提出,利用这一概念人们提出了多种聚类方法,比较典型的有:基于相似性关系和模糊关系的方法(包括聚合法和分裂法),基于模糊等价关系的传递
6、闭包方法、基于模糊图论最大树方法,以及基于数据集的凸分解、动态规划和难以辨识关系等方法.然而由于上述方法不适用于大数据量情况,难以满足实时性要求高的场合,因此其实际的应用不够广泛,故在该方面的研究也就逐步减少了.实际中受到普遍欢迎的是基于目标函数的方法,该方法设计简单、解决问题的范围广,最终还可以转化为优化问题而借助经典数学的非线性规划理论求解,并易于计算机实现.因此,随着计算机的应用和发展,该类方法成为聚类研究的热点。1.模糊聚类分析的基本过程(1)计算样本或变量间的相似系数,建立模糊相似矩阵;(2)利用模糊运算对相似矩阵进行一系列的合成改造,生成模糊等价
7、矩阵;(3)最后根据不同的截取水平λ对模糊等价矩阵进行截取分类。2.聚类分析的基本思想用相似性尺度来衡量事物之间的亲疏程度,并以此来实现分类.模糊聚类分析的实质则是根据研究对象本身的属性来构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系.模糊聚类分析是基于模糊等价关系进行的,其主要步骤为:(1)确定分类对象,抽取因素数据;(2)建立原始矩阵;(3)数据标准化:对数据进行标准化变化,将数据压缩到[0,1]之间;(4)建立模糊相似矩阵:模糊相似关系的建立,-15-关于各分类对象之间相似性统计量rij的计算,除了采用夹角余弦公式和相似系数计算公式。还有其他
8、一些公式,根据实际情况进行自行设计或参考相应的公式。