欢迎来到天天文库
浏览记录
ID:33581581
大小:2.49 MB
页数:43页
时间:2019-02-27
《基于用户兴趣特征的图像检索研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工业大学工学硕士学位论文性采用相关反馈技术动态提取图像的语义信息。许多专家正在更深入地研究Web与CBIR的结合,这是基于内容图像检索系统未来发展的趋势。1.2相关反馈技术相关反馈技术主要基于人机交互的思想,借助一种相关反馈的技术(RelevanceFeedback)来猜测用户的需求,并且根据用户的需求动态调整系统检索时所采用的特征向量或参与检索的不同特征的权重系数,从而尽量缩小低层[9]特征和高层语义之间的差距,提高算法的检索效果。其实,相关反馈是文本[9]检索领域的一个基本技术,Rui最先将其用到CBIR领
2、域,实验证明它的确十分有效。此项技术也是近几年CBIR研究的热点,许多相关反馈方法也相继被推出。目前,基于内容图像检索技术中所抽取的图像特征基本上是图像的底层视觉特征,它们与图像的实际语义是脱离的,底层视觉特征尚无能力辨别出图像中所包含的物体。无论采用何种特征,无论使用何种度量测度,最终决定两幅图像是否相似还取决于实际用户。由于侧重点的不同,不同的用户对图像的相似性的判断也存在不同的标准。为此需要研究如何使系统自动适应这种特定的需求,从而实现更好的查询效果。相关反馈是传统的基于文本信息检索中的一项有力技术。它根据用户
3、对前一次检索结果的相关性反馈,自动地调整查询,使调整后的查询更加接近用户的信息、需求。我们这里将该技术借鉴到图像检[9]索的领域中使用。具体过程是:系统首先返回给用户一组结果图像,用户对这些结果进行评价,系统从用户反馈信息中自动分析最能表征用户查询目标的特征,自动调整相似度的度量方法,然后进行新的查询,经过多次反馈,最终得到满意的结果。事实上,利用相关性反馈的方法是通过用户的反馈加入底层特征与高层语义进行关联的知识,只不过这个知识是由用户来提供。无论是文本检索还是图像检索中采用最多的都是向量模型,即将文本或者图像都表
4、示为特征空间中的向量形式。现有各种检索技术大多是以向量模型为基础,包括相关反馈技术在内。由于所有文本或图像都可以表示为向量形式,我们可以把它们看作是特征空间中的点,而检索过程实质上是寻找特征空间中离查询向量最近的那些点所对应的文本或图像。从向量模型的角度出发,我们可以将相关反馈技术分成两大类:查询向量优化算法和特征权重调整算法。在向量模型中,查询都可以表达为特征空间中的向量,也即点的形式,我们称为查询点。假设每次用户进行查询时,他心目中都有一个理想的查询点恰-3-哈尔滨工业大学工学硕士学位论文好能够准确地表达他的信息
5、、需求,我们称之为理想查询点。但实际上,用户必须借助某些其它对象或手段表达他的查询请求,比如输入查询文本或者提交范例图像等,这些查询文本或范例图像在特征空间中对应的点就是查询点。查询点应该比较接近理想查询点,但在一般情况下两者还是有明显差距的。查询向量优化算法的本质就是根据用户反馈信息来调整查询点,使之更加接近理想查询点,再用调整后的查询点去重新计算检索结果。在每次相关反馈中,用户都会提交一些他所认为的与查询相关或者不相关的范例(文本或图像),我们称为反馈正例和反馈负例。查询向量优化算法的具体做法是移动查询点,使之更
6、加靠近反馈正例在特征空间中所对应的点,同时远离反馈负例所对应的点,通过这种方式来接近理想查询点。大量实验结果表明,采用优化后的查询点重新计算的检索结果明显优于前一次的查询结果。这类算法中比较有代表性的是[10]MARS系统中实现的算法。当前利用相关反馈来辅助图像语义理解的研究较多,采用相关反馈模型也各不相同。在文献中,作者采用基于概率统计的分类模型,利用贝叶斯法则和[9]最大似然度的方法找到最佳目标图像类。而Rui基于内容图像数据库中的关键技术研究等采用空间变换模型实现相关性反馈,他们利用查询优化矢量和特征权矩阵逐步
7、逼近用户的目标图像,并把特征矢量映射到与人视觉相近的空间,在此空间中求相似度。这种方法理论上讲比较完美,但是空间变换模型比较复杂,优化过程比较困难。中作者采用聚类分析的方法,首先在原有的特征空间进行聚类,根据用户对训练样本的评价,把特征空间进行划分,形成不同的图像分类,使得相关图像落入同一类别或者距离相近的类中。在图像查询过程中根据类与类之间的距离确定图像的相似程度。[11]在反馈技术中,根据学习的信息源,用户跟踪的方法可分为两种:显式跟踪和隐式跟踪。显式跟踪是指系统要求用户对推荐资源进行反馈和评价,从而达到学习的目
8、的。但是因为显式跟踪要求用户参与进行反馈和评价,一般情况下,这种做法很难收到实效,因为需要中断用户的正常浏览和阅读方式,从而很少有用户向系统主动表达自己的喜好,即使能获得用户反馈,也没有办法判断用户输入的准确性。比较实际的是隐式跟踪,所有的信息由系统自动跟踪得到,通过得到的信息判断用户的兴趣,调整示例图像的特征权重,以求更好的满足用户检索的需要
此文档下载收益归作者所有