基于bow模型图像分类方法的研究

基于bow模型图像分类方法的研究

ID:34807447

大小:14.31 MB

页数:65页

时间:2019-03-11

基于bow模型图像分类方法的研究_第1页
基于bow模型图像分类方法的研究_第2页
基于bow模型图像分类方法的研究_第3页
基于bow模型图像分类方法的研究_第4页
基于bow模型图像分类方法的研究_第5页
资源描述:

《基于bow模型图像分类方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于BoW模型的图像分类方法研究摘要图像分类是图像分析与理解的基本问题之一。近年来,随着网络技术的飞速发展,越来越多的数字图像开始充斥人们的生活,如何对这些海量的图像信息进行快速、准确的分类,提取有用信息,就逐渐成为研究的热点之一。Bagofwords(BoW)模型最初应用于文档分类领域并因其简单而有效的优点得到了广泛的应用,计算机视觉领域的研究者们尝试将同样的思想应用到图像处理和识别领域,建立了由文本处理技术向图像处理领域的过渡。本文将BoW模型应用于图像分类领域,并在研究该技术的基础上,针对模型中存

2、在的一些缺陷进行了改进:首先,在研究了图像特征提取方法的基础上,针对传统的尺度不变特征变换(Scale.InvariantFeatureTransform,SIFT)描述子所存在的兴趣点有限、计算复杂度高以及在BoW模型中应用的局限性等问题,提出了一种改进的适用于BoW模型的多尺度DF.SIFT(DenseFastSIFT)描述子。该描述子采用密集抽取的方法对图像进行均匀像素间隔的兴趣点计算,且对每个特征进行多尺度描述,能够更加充分的利用图像信息,且保证了特征的尺度不变性。此外,与传统的SIFT描述子不

3、同,DF.SIFT描述子利用矩形窗代替高斯窗对图像进行平滑,对特征进行统一尺度分配,避免了定位兴趣点的复杂计算过程,提高了计算的效率。通过实验对DF.SIFT描述子进行了最优参数选取,使其在保证效率的同时提高了分类的正确率。其次,在分析了视觉词典构造方法的基础上,提出了一种基于稳定初值分布的聚类方法来对视觉词典进行构造,并且应用三角形不等式对计算进行了简化。该算法有效的解决了传统k—means聚类方法过度依赖初始中心选取的问题,避免了局部最优给分类性能带来的影响,减少了收敛的迭代次数,提高了计算效率。此

4、外,基于此视觉词典构造方法,本文还提出了一种基于权值分布的视觉词典直方图表示方法,该方法根据图像特征与视觉单词的距离不同,即对视觉单词的贡献不同,为其分配不同的权值,将这些权值求和作为图像的基于视觉单词库的直方图表示。结果表明,本文提出方法有效地提高了分类的性能,最后在此基础上分析了视觉词典库大小对分类结果的影响。最后,提出了一种基于兴趣区域(RegionofInterest,ROI)提取与金字塔匹配原理相结合的BoW模型优化方法,该方法首先对训练图像进行ROI提取,然后对其进行视觉单词的计算,由此生成

5、的视觉单词库更具有代表性,更能精确地描述图像类的特征,且能在一定程度上抵抗位置信息变化以及背景无用信息带来的影响。应用金字塔匹配原理对图像进行表示,能够初步应用图像中区域的空问信息,使匹配精度更高。实验研究了不哈尔滨工程大学硕士学位论文同的金字塔划分方法对分类结果的影响,验证了应用ROI提取与金字塔匹配原理相结合相比较于传统的BoW模型的优越性。文章最后整合全文,形成一个完整的优化模型进行实验,并与现有的相关方法进行了比较,结果表明,本文方法的分类结果要优于现有的其他同类方法。文章最后对本文方法的优劣性

6、进行了详细分析。关键词:图像分类;BoW模型;SIFT描述子;k.means聚类;ROI提取基于BoW模型的图像分类方法研究ABSTRACTImageCategorizationisoneofthefundamentalproblemsinimageanalysisandunderstanding.Recently,moreandmoredigitalimageshaveappearedinourlifewiththefastdevelopmentofInternet.Theproblemofhowto

7、categorizethegiantimageinformationrapidlyandaccuratelyinordertosearchfortheusefulinformationhasbecomearesearchfocus·TheBagofWords(BoW)modelwasoriginallyappliedindocumentcategorizationareaeXtensivelybecauseofitssimplenessandusefulness.Themainthoughtisrepr

8、esentingthedocumentasahistogramofaseriesofunorderedkeywords.Researchersincomputervisionareatriedtotransplantthesamethoughttoimageprocessingandrecognitionwhichleadtoatransitionfromdocumentprocessingtoimageprocessing.TheBago

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。