WEB图像语义特征的分析与提取研究及实现开题报告

WEB图像语义特征的分析与提取研究及实现开题报告

ID:479722

大小:29.50 KB

页数:4页

时间:2017-08-09

WEB图像语义特征的分析与提取研究及实现开题报告_第1页
WEB图像语义特征的分析与提取研究及实现开题报告_第2页
WEB图像语义特征的分析与提取研究及实现开题报告_第3页
WEB图像语义特征的分析与提取研究及实现开题报告_第4页
资源描述:

《WEB图像语义特征的分析与提取研究及实现开题报告》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、开题报告WEB图像语义特征的分析与提取研究及实现一、选题的背景、意义伴随着多媒体技术、计算机图像技术以及互联网技术的飞速发展,网络上的web图片数量呈集合技术增长,图像数据库容量不断增大,这对传统的数据库技术和早期的图像检索技术提出了严峻的挑战。如何从浩瀚的图像海洋中快速、准确地找出用户所需要的图像,已经收到广泛关注的研究课题。早期的图像检索技术是基于关键字的检索,这些关键字由人工进行标注,效率较低,得不到令人满意的检索结果,因为标注的方式不可能给出图像所有的特征,而且不同的用户对于同一幅图像的理解也是不同的。为了克服标注方法的不足,20世纪90年代初,CBI

2、R(Content—BasedImageRetrieva1)作为一种新的检索方法被提出并很快地成为了研究的热点。CBIR主要是根据图像的颜色、纹理、图像对象的形状及它们的空间关系等内容特征作为图像的索引,通过计算查询图像和目标图像的相似距离,然后按相似度进行检索。目前,国内外已经对“如何通过单一的视觉特征进行检索从而得到更好的效果”进行了大量的研究,但是实验表明,基于多种特征综合CBIR的结果优于基于单一视觉特征CBIR的结果。基于多特征的检索技术是一种综合的集成技术,其研究涉及认知科学、人工智能、模式识别、图像处理、信息检索等多个领域。目前国际上在基于多特征

3、的图像检索领域的诸多研究已经取得了很大进展,但仍存在很多不完善的地方,仍需进一步深入研究。二、研究的基本内容与拟解决的主要问题随着网络和多媒体技术的快速发展,在互联网上出现了海量的WEB图像。传统的基于内容的图像处理技术由于没有很好地考虑图像高层语义,因此,在实际应用中常常会失效。另一方面,由于WEB图像的特征维数较高,导致的运算量很大,从提高后续分类的准确率来说,都需要从WEB图像中提取出最为有效的可视化特征。本课题提出一种融合多种可视化特征的提取方法,并将其运用到针对WEB图像中自然风景图像的识别任务。具体为:充分利用人类的视觉感知,分析WEB图像的特性,

4、将多种图像的可视化特征相互融合,并通过建立适当的距离度量对图像进行有效识别,得到应用哪些可视化特征能够较好地表述WEB图像的高层语义的结论,并通过实验加以验证。提出的基于多种可视化特征融合的WEB图像语义特征提取方法,应建立在充分分析WEB图像的特性的基础之上,并利用人类的视觉感知来鉴别需要提取的特征的种类,选择并提取出来的可视化特征应具有表述WEB图像的特性的能力。提出的方法应能够在下载自互联网上的自然风景图像数据集上进行实验,以验证它的可行性和有效性。三、研究的方法与技术路线、研究难点,预期达到的目标目前图像语义的获取主要有3种来源,分别是基于知识的语义提

5、取;人工交互语义提取;利用外部信息源的语义生成,它们构成了目前语义提取方法的3条主线。1.利用系统知识的语义提取基于知识的语义提取,主要特征是需要预先给系统提供必要的知识,如对象模板、图像场景分类器等等。依据提取的语义内容和采取的方法,又可以分为基于对象识别的处理方法和全局处理方法。2.系统交互中语义的生成目前通用的完全自动的图像语义处理,还存在一些难以逾越的障碍。要在机器视觉、人工智能现有发展的水平上进行语义处理,必须充分考虑到人的作用,把人当作系统的一个组成部分。人工交互的语义提取,主要体现在图像库预处理和反馈学习两个方面。预处理最简单的情况是人工标注,更

6、加合理的方法是结合基于知识的方法:在特定的领域中,先让系统自动学习对象和场景的描述,再由人工修正。用户反馈可以起到两个作用,一是根据用户对于检索结果的操作,逐步把握用户真正的需求;二是根据用户的操作,建立特定语义与视觉特征的对应,或是修正与图像关联的高层概念。交互主要在两个层面上进行:①根据低层视觉特征的反馈;②对于高层概念与图像联系的修正。3.基于外部信息的语义提取外部信息源的语义提取,是指根据图像的来源处的其它信息,来获得与图像相关的相对高层的描述信息。由于多媒体描述方式的普及,目前图像出现在各种场合,报刊杂志、论文报告等电子文献,特别是在Internet

7、上的各种Web网页中,都出现大量的图像。Internet可以看成是一个巨型的媒体库,而且其中的信息都是非结构化的,在其上进行操作,往往比仅仅在本地的一个几万幅的演示图像库中检索更有意义。目前针对Internet,已有了实用化的Web文本检索技术,而对于图像等多媒体信息,目前还没有可靠的方法。图像语义的提取研究必须考虑人对图像的理解机制,这就要涉及到心理学和人的视觉认知模型。同时在多特征提取上采用何种算法来提取和分析才能更好体现原始web图像,融合颜色、纹理、形状等多特征也是个较难以解决的问题。从分析与挖掘WEB图像的特性出发,研究各种可视化特征,如颜色、纹理、

8、形状等的提取技术与方法,分析它们在获取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。