作业基于关联规则的图像数据挖掘研究

作业基于关联规则的图像数据挖掘研究

ID:41865222

大小:54.50 KB

页数:11页

时间:2019-09-03

作业基于关联规则的图像数据挖掘研究_第1页
作业基于关联规则的图像数据挖掘研究_第2页
作业基于关联规则的图像数据挖掘研究_第3页
作业基于关联规则的图像数据挖掘研究_第4页
作业基于关联规则的图像数据挖掘研究_第5页
资源描述:

《作业基于关联规则的图像数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、知识工程与知识发现的小论文基于关联规则的图像数据挖掘研究所在学院专业名称年级姓名学号完成日期2014年12月1日摘要为了能充分从大量的图像数据屮分析并提取有用信息,用关联规则的思想方法研究了数据挖掘中的前沿领域——图像数据挖掘技术,首先分析传统用在挖掘结构化数据关联规则的基本思想,然后分析图像数据的特征,找出图像数据与传统结构化数据的区别,最后结合图像数据的特性将传统的关联规则进行改进,并将它应用在图像数据挖掘屮,挖掘出图像数据的相关性。关键字:关联规则;图像数据挖掘;项集;描述集;支持度1引言传统数据挖掘处理的数据是数据库屮表格形式的记录和条目,属于结构型

2、数据。目前,由于音频视频设备、数码相机、CD-ROM和因特网的流行和普及,出现了如图形图像、文本、视频和音频等半结构化和非结构化的多媒体数据。因为多媒体数据挖掘对象的复杂性,导致一些常规的数据挖掘方法不能直接采用,也就使得多媒体数据挖掘理论和技术发展缓慢。目前大多数的研究都集中在图像数据挖掘方面,挖掘图像信息主要采用的技术有对象识别、图像索引和检索、图像分类和聚类、神经网络和关联规则挖掘等。关联规则挖掘是数据挖掘领域一个重耍的研究课题,它可以处理大量数据集,从其中发现项集之间频繁出现的有趣的关联或相关联系。近年来关联规则在结构化的数据挖掘屮已经逐渐走向成熟,

3、在许多商业应用领域取得了成功。关联规则反映数据项之间的相互蕴涵关系,因此关联规则挖掘也可以用来发现图像数据特征间的关系。本文结合图像数据的不同特性,将传统的关联规则思想应用在图像数据挖掘中。2.关联规则挖掘思想关联规则挖掘就是从大量的数据中挖掘岀有价值的描述数据项Z间相互联系的有关知识。该思想最早是由Agrawal等人针对分析购物篮问题提出的,其目的是为了发现交易数据库中不同商品之间的联系规则,分析顾客的购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁地被顾客同时购买,从而帮助他们开发更好的营销策略。例如,如果顾客在超级市场购物时购买了牛奶,他们多大可

4、能也同时购买面包?显然能够回答这些问题的有关信息肯定会有效地帮助商家进行有针对性的促销,以及进行合适的货架商品摆放。关联规则的一般性描述如下:设匸{iI?i2...ij为m个不同的数据项集合;设D为与任务相关的数据集合,其中每个事务T是I的一个数据项子集;每一个事务有一个识别编号TIDo设A是一个数据项集合,当且仅当A为T的子集吋称T包含A。一个关联规则就是具有如A・>B形式的蕴含式;其中A、B均为I的真子集,且AAB=0o规则A・>B在事务集D中成立,具有s支持度和c信任度。这就意味着事务数据集D屮有s比例的事务T包含有AUB数据项;且数据集D中有c比例的

5、事务T满足”包含A事务的同时也包含B”,A称为规则的前提,B称为规则的结果。这是条件概率P(B/A)0具体描述为:Support(A->B)=P(AUB)Confidence(A->B)=P(B/A)同时满足最小支持度(min_sup)和最小置信度(min_conf)的规则称作强规则。一个数据项的集合称为项集;一个包含k个数据项的项集就称为k-项集。一个项集的出现频度就是整个数据集D中包含该项集的记录数,这也称为该项集的支持度。若一个项集的出现频度大于最小支持度阈值乘以记录集D中的记录数,就称该项集满足最小支持度阈值。满足最小支持阈值的项集就称为频繁大项目集

6、。所有频繁k-项集的集合就记为Lko给定一个事务数据库D,关联规则挖掘问题就是通过用户指定最小支持度和最小置信度来寻找合适关联规则的过程。该过程首先要找出频繁性至少与预定义的最小支持度计数min_sup一样的频繁项集,然后再在每个最大频繁项目集中寻找可信度不小于给定的最小置信度的关联规则。对于生成关联规则来说,在每个最大频繁项目集中逐…进行可信度是否大于等于最小置信度的测试是必需的,也是相对比较容易的,因此,目前关联规则的发现主要就是找出频繁项目集。2.图像数据的关联规则挖掘3.1图像数据挖掘概述图像数据以点阵信息的形式存储,数据量很大,图像数据库和传统的关

7、系型数据库也存在巨大差异。第一,在关系数据库中,数据值在语义上是有意义的,例如年龄值50,这是容易理解的。然而在图像数据库中,如同灰度值为38这种信息,没有背景资料的支持就难以理解。第二,图像中包含的空间信息对研究图像内容至关重要,但在关系数据库中却并非如此。比如,为了识别出图像中的某一特别形状或模式,必须考虑位于相近位置上的一系列像素点。在关系数据库中,数据挖掘更关注的是某一条记录的特征,而不是它跟上一条记录或下一条记录之间的关系。第三,一个图像可以包含多个对象,每个对象可以有许多特征,如颜色、形状、纹理、关键词和空间位置,因此可能存在许多可能的关联。而关

8、系数据库中的关联就是记录内部的各个属性项的关联,相对

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。