人机交互论文-语音与听觉界面

ID：9174792

大小：436.18 KB

页数：10页

时间：2018-04-20

资源描述：

《人机交互论文-语音与听觉界面》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、摘要随着数字化及智能化的普及，在日常生活及工作中，我们随处可以见到一些语音与听觉系统的应用，像公交车的语音报站系统、语音邮件系统、手机的语音命令拨打电话等等，都是这样的应用。那么，本文就现阶段的一些语音与音频技术，包括离散词语识别、连续语音识别、语音信息系统、语音生成、非语音听觉交互五种，针对每一类技术各自的应用领域、优缺点及其发展趋势进行了详细地探讨、分析。最后，整体总结分析了语音与听觉界面当前的发展及其未来发展趋势。关键词：语音与听觉界面；离散词语识别；连续语音识别；语音信息系统；语音生成；非语音听觉界面1.引言对计算机讲话和让计算机说话的

2、梦想已经诱惑了很多研究人员及幻想家。1968年，ArthurC.Clarke在《2011：星际漫游》的书和电影中对HAL9000计算机的幻想，已经为科幻小说中计算机的性能和一些高级开发人员设定了标准。虽然硬件设计人员已经在语音识别、生成和处理方面取得了引人注目的进步，但是与科学小说的幻想相比，当前的成功仍是令人清醒的。那么在现阶段，语音与听觉交互到底有着怎么样的发展呢？在哪些领域进行的了应用呢？应用的效果怎么样呢？优势与劣势各是什么呢？针对上述这些问题，语音与听觉交互的发展趋势又会是怎样呢？这些都是本文将要讨论的问题。2.语音与听觉界面通俗易懂

3、的讲，语音交互是要实现对计算机讲话和让计算机讲话。目前语音交互取得了很多进展，但是仍然存在着很多不能忽视的问题。总的来讲，语音交互的实际应用只有在他们适合用户的工作速度快，认知负载底，出错率低的需要时才会成功。从这些需求来看，语音交互似乎都不能很好地满足用户的需要，原因是：首先，语音输出是相对缓慢的；其次，与手眼协调相比，语音命令对用户工作记忆的要求更高，对正在执行任务的用户影响更大，比如计划和问题求解便是这样的；最后，背景噪声和用户语音的变体对语音识别的挑战仍旧很大，使得语音的识别的出错率还是占有一定的比重。尽管语音交互存在着这么多不能忽视的

4、，不尽如人意的问题，语音交互仍有以下一些方面的优点：①语音存储转发和语音生成可预测、低成本、广泛可用。②对于有身体缺陷者，语音有明显好处。③电话会话的及时性和情感影响是人与人之间交流中引人瞩目的组成成分。语音和音频技术有五种：离散词语识别、连续语音识别、语音信息系统、语音生成、非语音听觉交互。接下来，就从这五个具体方面，解析语音交互的优点与缺点，及可能的发展趋势。2.1离散词语识别离散词语识别设备识别特定人所说的单个词，对于100~10000个词或更大的词汇量，其工作的可靠性能够达到90%~98%。目前，离散词语识别设备的使用分两种方式，一种是

5、由使用者通过特定方式对系统进行词汇学习训练，另外一种则不进行，因为更容易推广。因为技术的限制，语音识别设备的固有缺点，使得语音的识别率并不是很高，可以通过下列方式提高识别率：安静的环境、头戴式话筒、精心选择的词汇。离散词语识别技术的缺点是显而易见的，这种技术面临着如下的问题：因为他的不可靠的识别，许多用户不愿使用。语言识别设备的识别率低可能是由以下原因引起的：背景声音的改变、用户生病或者处于压力之下，词汇表中的单词相似。其优点则是，通过语音识别设备，使用者就可以把眼睛与手等本来要用于关注指令的器官解放出来。当然这个优点是有局限性地，因为语音设备

6、的使用，必然会占用用户的更多的工作记忆。所以并不能适应用户过多使用工作记忆的场合。从上面对语音交互设备优点的阐述，可以知道，在一些特定的领域，语音识别仍有着较好的应用，比如飞机发送机机检察员就是用着语音系统。他们一边检查设备，一边通过头戴无线话筒发指令。同样地，离散词语识别设备针在身体有残疾者已经有着较好的应用。相反地，如果是在普通的计算机应用系统上,使用显示器的用户就会明显胜于使用语音系统的。因为使用光标来检索或者操作比使用语音不论是从识别率还是效率上都要高效。用户的手脚与眼睛并不需要那么忙碌，而通过语音设备解放出来。尽管从绘图程序对调色版的

7、选取上来看，语音系统快过光标系统。问题是，语音系统占用用户的更多记忆。对于需要短时记忆工作的场景不合适。因而对于语音系统，最重要的一点不足就是说命令或者听对计划和问题求解的破坏更大，会占用用户的工作记忆，在一些很需要工作记忆的地方就会暴漏出语音识别设备的不足。而在一些不太需要工作记忆的场合，比如玩具使用者的身上，语音设别就可以成功应用。由于语音会占用用户的工作记忆这一点并不是容易解决的问题，当前研究项目就会专注于提高在困难条件下的识别率，使得语音识别系统在那些可以使用的场合下可以更高效地使用。这些研究包括尽量消除对与讲话者有关训练的需要，并把处

8、理的词汇增加到1万个以上。基于移动设备的、基于语音的文本输入也在改进。这些困难条件就会包括，语音文本输入效率低、方言噪声干扰影响语音识别等。总结上述对

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 10



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

人机交互论文-语音与听觉界面

人机交互论文-语音与听觉界面

相关文章

相关标签