加权关联规则算法在图像标注领域中的应用

加权关联规则算法在图像标注领域中的应用

ID:31360831

大小:112.00 KB

页数:8页

时间:2019-01-09

加权关联规则算法在图像标注领域中的应用_第1页
加权关联规则算法在图像标注领域中的应用_第2页
加权关联规则算法在图像标注领域中的应用_第3页
加权关联规则算法在图像标注领域中的应用_第4页
加权关联规则算法在图像标注领域中的应用_第5页
资源描述:

《加权关联规则算法在图像标注领域中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、加权关联规则算法在图像标注领域中的应用  摘要:将关联规则挖掘算法推广到图像标注领域,提出了适用于图像语义标注任务的加权关联规则挖掘算法。通过为每个标签及标签集合赋予一定权重,可以保留出现次数少却具有重要意义的标签,以更好地挖掘语义标签之间潜在的有价值的规则。对语义概念之间的层次关系进行了研究,利用高层语义概念对图像标签的结果集合进行扩展,以避免人工标注过程中的不完整标注和遗漏标注问题。实验验证表明,该算法在发现关联规则的数量和扩展标签的质量上性能都优于经典的Apriori算法,证明了该算法的有效性。  关键词:语义

2、标签关联关系;图像标注;加权支持度;加权置信度;语义概念分层  DOIDOI:10.11907/rjdk.161689  中图分类号:TP319  文献标识码:A文章编号:16727800(2016)010013004  0引言  随着科技的飞速发展,智能手机、数码相机、平板电脑等电子产品的普及率大大提高,使得图像的获取和传播变得非常简单、迅速。因此,如何有效地检索和管理海量的图像数据集成为人们面临的难题。  目前,图像检索主要分为两种方式:基于文本的图像检索(TextbasedImageRetrieval,TBIR

3、)和基于内容的图像检索(ContentbasedImage8Retrieval,CBIR)。TBIR要求被查找的图像具有与其视觉内容相匹配的文字描述,从而将图像检索问题转换成文本检索问题。这种检索方法虽然简便直观,但在实际生活中,大部分图像是不具有标签的,少量带有标签的图像也可能没有被完整标注,不满足基于文本检索的前提条件,通常并不可行;CBIR[14]利用计算机自动提取图像的颜色、纹理、形状、空间位置等低层视觉特征,创建特征索引,储存在特征库里。然而基于内容的图像检索在查找过程中仅依靠图像的视觉特征,并没有深入分析

4、和理解图像内容。由于图像的低层视觉特征与高层语义之间存在“语义鸿沟”[5,6]问题,导致输出的图像往往与用户的输入图像不相关,检索结果不能令人满意。针对以上问题,对图像建立基于语义的表示和检索机制势在必行。语义标注实质是提取能反映其内容的语义关键词,解决图像低级视觉特征与高级语义之间的“鸿沟”问题。  目前,人们在图像语义标注方面的研究已取得了一定成果,这些成果都是针对不同出发点提出的不同解决方案。本文主要针对由于标签之间隐含的内在关联被忽略而导致用户进行不完整标注或错误标注,使经典的关联规则挖掘算法(Apriori

5、)变得不再可行的问题,提出了适用于图像语义标注任务的加权关联规则挖掘算法。  1图像标注中标注词之间的关联关系问题8  在现实世界中,利用Instagram、Flickr、Photobucket、TinyPic等图片分享网站,可以收集大量带有用户手动标注的图片。但由于用户关注的角度与理解不同,或用户的错误标记,导致手动标注的图片中有很大一部分都是不完整标注的,或是带有噪声的。通常存在这样的现象,如果一个用户为一幅图片添加标签“笔记本”,那么该用户几乎不会再为这幅图片添加“电脑”标签,在这种情况下,隐含的、潜在有意义的

6、标签则不能被完全包含在用户手动标注的标签集中,从而产生不完整标注。产生上述现象的原因是因为标签之间隐含的内在关联被忽略了。  本文提出一种适用于图像语义标注任务的加权关联规则挖掘算法(WeightedAssociationRuleMiningforImageAutoannotation,简称WARMFIA),用于挖掘标注词之间的关联关系,并利用挖掘出来的规则和语义概念层次关系对标注词进行扩展,形成候选标签集。WARMFIA通过为每个标签及标签集合赋予一定权重,保留那些出现次数少但具有重要意义的标签,以更好地挖掘语义标

7、签之间潜在的有价值的规则。  2加权关联规则挖掘算法  在一个大规模标注的图像数据集中,如果两个或两个以上的语义标签经常一起出现,这些标签可以被认为高度相关。这种现象被称为标签共现,标签共现是语义标签相关性度量的关键。  在实际中,一组共现的标签集合通常在语义概念上存在关联。例如,当用户在标注一幅联想笔记本的图片时,他们更有可能标注“laptop”、“ThinkPad”或”notebook”,而不是标注”computer”、”Lenovo”。用户对该图片和与其相似图片标注的标签如表1所示,其中TID表示图片编号,每行

8、对应一个事物,即一幅图片,每列对应一个项,即语义标签。标签可以用二元变量表示,如果图像具有这个标签,则它的值为1,否则为0。  考虑规则{laptop,ThinkPad}→8{computer},通常computer与标签集{laptop,ThinkPad}之间的相关性比laptop与computer或ThinkPad与computer之间的相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。