基于特征区的显著性快速分析.doc

ID:59428591

大小:2.54 MB

页数:8页

时间:2020-05-25

基于特征区的显著性快速分析.doc_第1页
基于特征区的显著性快速分析.doc_第2页
基于特征区的显著性快速分析.doc_第3页
基于特征区的显著性快速分析.doc_第4页
基于特征区的显著性快速分析.doc_第5页
资源描述:

《基于特征区的显著性快速分析.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于图像显著性快速场景分析的模型摘要:受早期神经元视觉系统结构的启发,一个视觉注意一通被创建出来。多种图像特征结合于一张地志显著性图样上。一个动态神经元网络依显著性递减的顺序选择位置。系统用有效的计算方法解决了关于快速选择场景识别的复杂问题,从而具体分析显著性的位置。1.导语灵长类动物具有实时识别复杂场景的出色能力,尽管他们神经元硬件在实现这些功能时是需要一定时间的。中层或更高层的视觉倾向于在整个过程当中先选择一个集中区域,这很可能是为了减少分析过程的复杂程度。这种选择通过形成一个有限空间的视觉区域来实现,通常称作”集中的注意”,这种快速、从上往下、显著性驱使和目标的独立的浏览方法也

2、就是缓慢地从下往上,意志驱使,目标分散的方法。注意力模型里包含一种叫“动态路线”的模式,这种模式下的信息来源于一小块区域可以通过表层视觉来活动。这种区域是通过对表层关联性或者是实时活动模式的修改来选择,在从上往下(目标-独立)和从下往上(场景-依赖)的控制下。这里用到的模型建立在一个被Koch和Ullman所推荐并且基于多种基本模型看似可信的次等生物结构上,它和一种“特征集成理论”想关联,解释了人类视觉寻找策略。视觉输入首先被分解成一些具图像特征的图谱。不同的空间位置具有不同的显著性,只有那种可以从周围环境中脱颖而出的位置才能出现。所有特征图谱以一种纯粹的由下往上的方式流入一个从整个

3、可见场景依照地理位置为不同位置的显著性编码主宰“图像显著性”。在最初期。这种图谱被认为是在次级顶骨腔壁和丘脑的枕核中心。模型的显著图谱被赋予可以形成注意性转变的内部动态。因此模型显现出一种完整的自下而上的显著性并且不需要任何自上而下的引导去转变注意。这种结构提供了一个用来快速选择一小群赋予吸引力图像位置的巨大平行的方式。这种位置需要以一种更复杂而且时间不确定物体识别的过程。将这种方式延伸到“引导寻找”从跟高的表层区域反馈本来是用作衡量不同特征的重要性,所以只有较高级别重要性的才能到达进一层的过程。1.模型输入的静态图像通常被数字化正分辨率为640﹡480像素的图片。利用二阶高斯三角创

4、建的九度空间是一个渐进低通滤波器并且从八个阶梯采样尺度从1:1(零度空间)到1:256(八度空间)的图像。每个特征都被一系列“中心环绕”操作计算,类似于视觉可接受范围:典型视觉神经元在一个小区域的视觉空间里(中心)是最敏感的,当刺激作用在一片更宽,更弱和抑制神经反应的中心(周围)同心的对抗性区时。这样一个对空间不连续性敏感的结构,恰好适合于发现那些从环境中凸显并且是一个在视网膜,侧面膝状原子核,和初级视觉皮质的一般计算性公式。中心环绕在一个模型中被当作细小于粗大范围之间的区别而实行,中心是一个像素为c∈{2,3,4},环绕是于在s=c+δ(δ∈{3,4})范围内的像素。两幅图之间跨尺

5、度的差别(用Θ标记),通过插入细小范围和点对点的减法来获得。不仅是为了获得c,用几个范围更是为了获得δ=s—c服从通过包含在中心与环绕区域之间不同大小比率多尺度特征提取(和之前使用的修正比率相反)。2.1早期视觉特征的提取r,g和b分别是红,绿和蓝色的图像输入通道,图像的密度I=(r+g+b)/3。变量I用来创建一个高斯三角I(σ),而σ∈【0,8】。I使得r,g和b规范化从而将色度去耦成为密度。然而由于色度的变换在低亮度是不能被感知到(所以它不是显著的),规格化只应用于当I的值大于整个图像最大值得1/10时(其他地方r,g和b的值为0)。四个广泛调谐的颜色通道被建立:红色通道R=r

6、-(g+b)/2,绿色通道G=g-(r+b)/2,蓝色通道B=b-(r+g)/2,和黄色通道Y=(r+g)/2-

7、r-g

8、/2-b(负值归于零点)。四个高斯三角R(σ),G(σ),B(σ),Y(σ)因四个颜色通道建立。中心环绕()于:“中心”小范围的c和“环绕”大范围的s的不同产生了特征图。第一批的特征图谱更关注密度的对比,在哺乳类动物中,由神经元发现敏感不是较暗的中心及较亮的环绕,就是较亮的中心及较暗的环绕。这里,两种不同类型的敏感度同样是由一系列六个图谱I(c,s)c∈{2,3,4},s=c+δ,δ∈{3,4}来计算的I(c,s)=

9、I(c)θI(s)

10、下一层的图谱同样是为了在皮

11、质中代表了叫做“颜色双倍反对”系统的颜色通道而建立的,在可以感知范围内的中心,神经元被一种颜色刺激(比如红色)并且被另一种颜色屏蔽(比如绿色),然而在环绕部分,事实正好相反。这样的空间和色彩的对立如红/绿,绿/红,蓝/黄,和黄/蓝成对的存在人类初级视觉皮质。因此,图谱RG(c,s)针对那些对立的颜色如红绿和绿红,而BY(c,s)针对蓝黄和黄蓝被建立在一个模型里。RG(c,s)=

12、(R(c)-G(c))θ(G(s)-R(s))

13、BY(c,s)=

14、(B(c)-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
正文描述:

《基于特征区的显著性快速分析.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于图像显著性快速场景分析的模型摘要:受早期神经元视觉系统结构的启发,一个视觉注意一通被创建出来。多种图像特征结合于一张地志显著性图样上。一个动态神经元网络依显著性递减的顺序选择位置。系统用有效的计算方法解决了关于快速选择场景识别的复杂问题,从而具体分析显著性的位置。1.导语灵长类动物具有实时识别复杂场景的出色能力,尽管他们神经元硬件在实现这些功能时是需要一定时间的。中层或更高层的视觉倾向于在整个过程当中先选择一个集中区域,这很可能是为了减少分析过程的复杂程度。这种选择通过形成一个有限空间的视觉区域来实现,通常称作”集中的注意”,这种快速、从上往下、显著性驱使和目标的独立的浏览方法也

2、就是缓慢地从下往上,意志驱使,目标分散的方法。注意力模型里包含一种叫“动态路线”的模式,这种模式下的信息来源于一小块区域可以通过表层视觉来活动。这种区域是通过对表层关联性或者是实时活动模式的修改来选择,在从上往下(目标-独立)和从下往上(场景-依赖)的控制下。这里用到的模型建立在一个被Koch和Ullman所推荐并且基于多种基本模型看似可信的次等生物结构上,它和一种“特征集成理论”想关联,解释了人类视觉寻找策略。视觉输入首先被分解成一些具图像特征的图谱。不同的空间位置具有不同的显著性,只有那种可以从周围环境中脱颖而出的位置才能出现。所有特征图谱以一种纯粹的由下往上的方式流入一个从整个

3、可见场景依照地理位置为不同位置的显著性编码主宰“图像显著性”。在最初期。这种图谱被认为是在次级顶骨腔壁和丘脑的枕核中心。模型的显著图谱被赋予可以形成注意性转变的内部动态。因此模型显现出一种完整的自下而上的显著性并且不需要任何自上而下的引导去转变注意。这种结构提供了一个用来快速选择一小群赋予吸引力图像位置的巨大平行的方式。这种位置需要以一种更复杂而且时间不确定物体识别的过程。将这种方式延伸到“引导寻找”从跟高的表层区域反馈本来是用作衡量不同特征的重要性,所以只有较高级别重要性的才能到达进一层的过程。1.模型输入的静态图像通常被数字化正分辨率为640﹡480像素的图片。利用二阶高斯三角创

4、建的九度空间是一个渐进低通滤波器并且从八个阶梯采样尺度从1:1(零度空间)到1:256(八度空间)的图像。每个特征都被一系列“中心环绕”操作计算,类似于视觉可接受范围:典型视觉神经元在一个小区域的视觉空间里(中心)是最敏感的,当刺激作用在一片更宽,更弱和抑制神经反应的中心(周围)同心的对抗性区时。这样一个对空间不连续性敏感的结构,恰好适合于发现那些从环境中凸显并且是一个在视网膜,侧面膝状原子核,和初级视觉皮质的一般计算性公式。中心环绕在一个模型中被当作细小于粗大范围之间的区别而实行,中心是一个像素为c∈{2,3,4},环绕是于在s=c+δ(δ∈{3,4})范围内的像素。两幅图之间跨尺

5、度的差别(用Θ标记),通过插入细小范围和点对点的减法来获得。不仅是为了获得c,用几个范围更是为了获得δ=s—c服从通过包含在中心与环绕区域之间不同大小比率多尺度特征提取(和之前使用的修正比率相反)。2.1早期视觉特征的提取r,g和b分别是红,绿和蓝色的图像输入通道,图像的密度I=(r+g+b)/3。变量I用来创建一个高斯三角I(σ),而σ∈【0,8】。I使得r,g和b规范化从而将色度去耦成为密度。然而由于色度的变换在低亮度是不能被感知到(所以它不是显著的),规格化只应用于当I的值大于整个图像最大值得1/10时(其他地方r,g和b的值为0)。四个广泛调谐的颜色通道被建立:红色通道R=r

6、-(g+b)/2,绿色通道G=g-(r+b)/2,蓝色通道B=b-(r+g)/2,和黄色通道Y=(r+g)/2-

7、r-g

8、/2-b(负值归于零点)。四个高斯三角R(σ),G(σ),B(σ),Y(σ)因四个颜色通道建立。中心环绕()于:“中心”小范围的c和“环绕”大范围的s的不同产生了特征图。第一批的特征图谱更关注密度的对比,在哺乳类动物中,由神经元发现敏感不是较暗的中心及较亮的环绕,就是较亮的中心及较暗的环绕。这里,两种不同类型的敏感度同样是由一系列六个图谱I(c,s)c∈{2,3,4},s=c+δ,δ∈{3,4}来计算的I(c,s)=

9、I(c)θI(s)

10、下一层的图谱同样是为了在皮

11、质中代表了叫做“颜色双倍反对”系统的颜色通道而建立的,在可以感知范围内的中心,神经元被一种颜色刺激(比如红色)并且被另一种颜色屏蔽(比如绿色),然而在环绕部分,事实正好相反。这样的空间和色彩的对立如红/绿,绿/红,蓝/黄,和黄/蓝成对的存在人类初级视觉皮质。因此,图谱RG(c,s)针对那些对立的颜色如红绿和绿红,而BY(c,s)针对蓝黄和黄蓝被建立在一个模型里。RG(c,s)=

12、(R(c)-G(c))θ(G(s)-R(s))

13、BY(c,s)=

14、(B(c)-

显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭