计算机视觉和图像理解论文

ID：6198714

大小：2.08 MB

页数：26页

时间：2018-01-06

资源描述：

《计算机视觉和图像理解论文》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、计算机视觉和图像理解毕业论文1.导言在社会机器人的新兴领域，人类–机器人相互作用通过手势是一个重要的研究课题。人类进行交际的手势中，指向手势的互动与机器人特别有趣。他们开放的直观指示对象和位置的可能性，是特别有用的机器人的命令。指向手势也可结合语音识别指定的口头陈述和位置参数，还提供了一个明确的输入语音识别时发生歧义。这种类型的一个例子的情况是指向手势引导机器人到一个特定的对象或使用地点。机器人必须能够检测的指向手势和估计目标位置，从而指出，主要的问题出现，有关最近在这一领域的研究视野[1–4,8]。一些最重要的挑战是相关的

2、实时计算，得到的精度和运行在困难的杂乱环境可能遮挡，光照和不同的背景。另一个共同的要求是，指向手势必须认识到，无论规模大小，大指向手势是指进行全臂延伸而小的指向手势只减少前臂和手的运动[3,4]。基于这一事实，对于大多数应用程序，它是指目标而不是实际的指向，这是非常重要的，我们制定了一个新的方法，与现有的指向手势识别的方法，也考虑到可能指出目标位置的先验信息。假设的指示语的手势，最常见的类型例如，一个涉及食指指向对象的利益和用户的目光指向同一目标[5,6]我们制定我们的方法使用单眼设置高精度跟踪下飞机头部旋转，同时识别手指的

3、手势。这两种输入流被组合在一起推导出指向目标使用的配方是基于Dempster-Shafer理论的证据[7]。一种区别我们的方法来自使用相机基本的方法，多数使用立体声或多摄像机设置。然而，本文的主要内容在于基于Dempster-Shafer理论输入端的组合，让该方法在一种或两种输入数据流丢失的情况下能妥善处理（例如手指向的来自遮挡了的可见光）；也就是，使用的输入的信号缺乏，实现了令人印象深刻的结果，这是当代概率融合方法不可能得到的来源[1,8]。此外，本文所提出的制定的信念被分配到设置尖锐的目标而不是个人提出的目标。Demps

4、ter的组合规则有助于这些信念相结合，而不需要将他们的个人目标的分别观测指出，假如没有明确的建议。在下面的章节中对相关工作（第2节）和提出的方法（第3节）进行了论述。手指的手势识别的简要讨论在第4节而人脸姿势识别在第5节进行了阐述。人脸姿态和手指的融合，是本文的重点，在第6节进行了分析。在模拟环境下的实验结果及其使用的地面真实数据的结果在第7节。本文的结论与讨论在第8节。2相关的工作手势识别的研究近年来受到越来越多的关注，也超越了人类–机器人互动的区域，例如在情感计算和身临其境的游戏技术。第一次尝试解决手势解读导致的机械装置

5、，直接测量手或手臂的关节角度和空间位置，所谓的手套设备[9]。随着计算机视觉技术及快速处理器可用性的最新研究进展，在基于视觉的非接触式接口增加了可穿戴设备，克服阻碍缓解作用的弊端。最近基于视觉的手势识别技术作了较全面的介绍[11]而且大部分的努力都集中在手势识别[12,6]以及手语翻译[13,14]。基于视觉手势的研究指出，有使用立体声或多摄像机系统的几种方法，这只手/手臂、双手、手臂和头。他们中的大多数估计指向在水平方向上，而其他的一些在水平和垂直方向。在那些用手或手臂，奇波拉等人。[15]利用立体视觉与主动轮廓跟踪的位置

6、和指向对机器人的两维空间。Hosoya等人[16]衍生的肩膀和手臂的深度和立体彩色图像的三维位置来估计三维指向。最近，Huetal[17]用合适的AdaBoost级联反应检测器[18]的手势检测和指向从立体图像估计的主动外观模型，然而检测时间高成本。其他作者的关于人脸的三维位置和指向手使用的信息，以获得视线和估计的指向。Jojic等人。[19]识别指向手势的基础上密集的视差图和辨别从身体的手臂的统计模型和估计的指向从头部和手部的极值点。在Stiefelhangen和Nickel的工作中[1,2,20]使用神经网络的头部姿态估

7、计和基于HMM模型的方法来识别指向手势。然而，他们的方法因延迟识别搜索三种特征序列检测的指向手势。Kelh和VanGool[21]，以及Watanabe等人。[22]利用多摄像机系统检测脸和手。首先提取人体轮廓，头和手的极值点，解决了三维的对应关系和推导出的指向。图像分割的质量有很强的影响该方法的准确度，这在[21]是不定量评估。后者估计人脸方向八可用相机离散面方向特征类一起使用它的3D手的位置指向估计。最近，Park和Lee[4]，基于立体相机，使用同样的[2]一个基于HMM的方法在两个阶段识别指向手势，但在指向手势的不同

8、定义的。本文考虑的姿态，但规模第一，该方法的精度主要取决于第一阶段的HMM的状态数，因此需要更多的训练数据和处理时间。这些方法中的一些遭受延迟识别，例如[2,17]，有限的精度评估，例如21,17]和大多数的（除非在这里[4]）不支持手势规模。不像我们使用一个单一的摄像头，可以放置在一个移

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 26



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

计算机视觉和图像理解论文

计算机视觉和图像理解论文

相关文章

相关标签