图像数据库关联规则挖掘方法探究

图像数据库关联规则挖掘方法探究

ID:46672145

大小:70.50 KB

页数:7页

时间:2019-11-26

图像数据库关联规则挖掘方法探究_第1页
图像数据库关联规则挖掘方法探究_第2页
图像数据库关联规则挖掘方法探究_第3页
图像数据库关联规则挖掘方法探究_第4页
图像数据库关联规则挖掘方法探究_第5页
资源描述:

《图像数据库关联规则挖掘方法探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、图像数据库关联规则挖掘方法探究摘要:在多媒体应用中,图像数据库的使用日趋广泛,为了更有效地使用图像数据库,许多数据挖掘技术被用于图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。关键词:图像数据库数据挖掘FP增长算法中图分类号:TP301文献标识码:A文章编号:1007-9416(2012)10-0083-021、引言随着计算机网络的发达及多媒体应用的日益广泛,各种图像、音频、视频数据在信息交互中成为出现最多的信息载体,尤其是图像信息,能使用直观的画面呈现出丰富的

2、信息。然而在庞大的图像数据库中查找出相关数据,将图像画面内容与非图像内容特征建立联系,是高效使用图像数据的保障。近年来,为了提高图像数据库的性能,数据挖掘技术被应用到图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,并基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。2、图像数据库中的关联数据挖掘是知识发现过程的一个步骤,从存放在数据库、数据仓库或其他信息库中的大量数据中发现有用的知识的过程[1]。面对图像数据库里庞大的数据量,如何高效地查询出有用的数据,简单的字段匹配方法无法应用于图像数据的匹配,无法作出是否关

3、联的判断。而数据挖掘技术能通过相应的方法将图像数据的特征与存储的数据联系在一起,挖掘出两者的关联规则。因此,使用数据挖掘技术能有效找出图像数据的关联规则,从而查询出有用图像数据。数据的关联主要关注的是满足最小支持度阈值和最小置信度阈值的关联规则。图像数据与一般的数据相比,其特征都是包含在图片信息中,因此,在图像数据库中可以挖掘涉及多媒体对象的关联规则,至少要包含以下三类:第一,图像内容和非图像内容特征间的关联。图像内容是图片上体现的具体内容,而非图像内容特征则是对具体内容的描述或分类的描述。在进行图像搜索等处理过程中需要把这两者建立有效的关联。第二,与空间联系无关的图像内容

4、间的关联。此关联考虑的都是图像内容。第三,与空间联系有关的图像内容间的关联。此关联把图像中的对象与空间联系关联在一起。3、基于图像数据的FP增长算法FP增长算法是可以避免重复地扫描数据库,不使用候选集,采取分治的策略,直接压缩数据库成一个频繁模式树,但仍保留项集关联信息。然后将压缩后的数据库划分成一组条件数据库,每个关联一个频繁项,并分别挖掘每个条件数据库,最后生成关联规则[2]。首先将每个图像数据的属性设计为图像内容项、非图像内容项描述。其中图像内容项描述包括与空间联系有关的图像内容项和与空间联系无关的图像内容项。其次,完成图像数据的输入和存储操作,形成图像数据库D;—副

5、图像用Ts表示,一个属性项用item_name表示;设最小支持度阈值为min_supl,具体算法步骤如下:步骤1:按以下步骤构造FP树:(a)扫描图像数据库D一次。收集频繁项的集合F和它们的支持度计数。对F按支持度计数降序排序,结果为频繁项列表Lo例如:图像内容项里有50%为蓝色而非图像内容特征描述为“天空”,则只要满足这种关联的图像作为一次计数。(b)创建FP树的根节点,以“null”标记。对于D中的每个数据Ts(即一副图像),执行:选择Ts中的频繁项,并按L中的次序排序。设排序后的Ts中频繁项列表为[p

6、P],其中,p是第一个元素,而P是剩余元素列表。调用insert_

7、tree([p

8、P],T)o该过程执行情况如下:如果T有一个子女N使得N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过节点链结构将其链接到具有相同item_name的节点。如果P非空,递归地调用insert_tree(P,N)o步骤2:FP树的挖掘通过调用FP_growth(FP_tree,null)实现。该过程实现如下:procedureFP_growth(Tree,a)(1)ifTree含单个路径Pthen(2)foreach路径P中节点的每个组合(记作B)(3)产生模式3Ua,其支持

9、度计数support_count等于B中节点的最小支持度计数;(4)elseforTree的头表中的每个ai{(5)产生模式B=aiUa,其支持度计数support_count=ai・support_count;(6)构造B的条件模式基,然后构造B的条件FP树TreeB;(7)ifTree37^?then(8)调用FP_growth(TreeP,B);}4、图像数据库系统为了挖掘图像数据特征之间的关联,在FP增长算法中将每一个图像看作一个事务,找出在不同图像中频繁出现的模式。在图像数据库中挖掘关联规则主要注意以下几

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。