视觉听觉触觉在人机交互中的应用

视觉听觉触觉在人机交互中的应用

ID:7824773

大小:25.05 KB

页数:3页

时间:2018-02-27

视觉听觉触觉在人机交互中的应用_第1页
视觉听觉触觉在人机交互中的应用_第2页
视觉听觉触觉在人机交互中的应用_第3页
资源描述:

《视觉听觉触觉在人机交互中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、视觉听觉触觉在人机交互中的应用计科110111281004郭珣摘要:人机交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。现在多数软件的交互设备还限制在鼠标、键盘、触摸屏、显示器等基本的输入输出设备上,为了是用户更加方便快捷地进行操作.在这里,主要讲述三种感官在人机交互中的运用,如何借助计算机模拟的视觉听觉触觉能力来实现更加方便高效的人机交互.关键词:人机交互交互设备计算机视觉听觉触觉人机交互界面,是系统面向用户的部分,用户通过人机交互界面与系统交流,是计算机系统向用户提供的综

2、合操作环境,是计算机系统的重要组成部分。而自适应人机界面的设计基于这样的假设,即计算机系统能够通过评价用户的操作行为及环境状态,使自己适合用户的期望和任务要求,从而打破计算机和用户之间的通讯障碍。1.视觉在人机交互中的应用  在人们的交谈和彼此间的交互过程中,视觉信息显然是很重要的。通过视觉的模态,我们可以立即确定许多显著的关于他人的事实和特征,包括他们的位置、身份、大致的年龄、注意力的焦点、脸部表情、姿势、手势和一般的活动。这些视觉线索影响到了会话的内容和进程,并提供了一些上下文相关的信息,这些信息与

3、言语不同,但与此相关,例如,一个手势或面部表情可能是一个关键的信号,一个注视的角度可能可以消除在言语中“这个”或者“在那边”的指带不明。换言之,在人与人的交互中,视觉和言语是联合表达,相互补充的通道。正如语音自动识别是试图构造能够感知人们交流的文字方面的机器,那么计算机视觉技术是用来构造能够“观察人”并自动感知相关视觉信息的机器。由上,计算机视觉技术显得尤为重要,计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“看”的能力的计算学科。通过理解图像形成的几何和辐射线测定,接受器(相机)的属性和物理

4、世界的属性,就有可能(至少在某些情况下)从图像中推断出关于事物的有用信息,例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是MRI扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向,现在已成为一个活跃的研究领域并长达40年了。但经过我查阅资料,我认为计算机视觉技术的发展相对于语音技术而言,仍旧比较原始,语音技术已经做到了成熟的商业化推广,发展了几十年.因此,在

5、计算机视觉技术方面,仍然有大有作为的地方.2.听觉在人机交互中的应用对于计算机听觉,也就是语音识别技术,相对于计算机视觉而言,听觉技术的发展成就比较突出,发展也更为成熟.目前在大词汇语音识别方面处于领先地位的IBM语音研究小组,就是在70年代开始了它的大词汇语音识别研究工作的。AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究历经10年,其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。这一时期所取得的重大进展有:(1).隐式马尔科夫模型(HMM)技术的成熟和不断完善成为语

6、音识别的主流方法。(2).以知识为基础的语音识别的研究日益受到重视。在进行连续语音识别的时候,除了识别声学信息外,更多地利用各种语言知识,诸如构词、句法、语义、对话背景方面等的知识来帮助进一步对语音作出识别和理解。同时在语音识别研究领域,还产生了基于统计概率的语言模型。(3).人工神经网络在语音识别中的应用研究的兴起。在这些研究中,大部分采用基于反向传播算法(BP算法)的多层感知网络。人工神经网络具有区分复杂的分类边界的能力,显然它十分有助于模式划分。特别是在电话语音识别方面,由于其有着广泛的应用前景,

7、成了当前语音识别应用的一个热点。另外,面向个人用途的连续语音听写机技术也日趋完善。这方面,最具代表性的是IBM的ViaVoice和Dragon公司的DragonDictate系统。这些系统具有说话人自适应能力,新用户不需要对全部词汇进行训练,便可在使用中不断提高识别率。中国的语音识别技术的发展: ⑴在北京有中科院声学所、自动化所、清华大学、北京交通大学等科研机构和高等院校。另外,还有哈尔滨工业大学、中国科技大学、四川大学等也纷纷行动起来。总而言之,我校在计算机语音研究方面,在国内占有一定地位,语音技术是

8、一个相对成熟的技术,目前该技术发展仍然很快速,近几年有如下进展,特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。重大进展:1)将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带RBM预训练的多层神经网络,极大提高了声学模型的准确率。在此方面,微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型(DNN)后,语音识别错误率降低了30%,是近20年来语音识别技

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。