鼎铭ASR应用解决方案

鼎铭ASR应用解决方案

ID:8548213

大小:2.68 MB

页数:8页

时间:2018-04-01

鼎铭ASR应用解决方案_第1页
鼎铭ASR应用解决方案_第2页
鼎铭ASR应用解决方案_第3页
鼎铭ASR应用解决方案_第4页
鼎铭ASR应用解决方案_第5页
资源描述:

《鼎铭ASR应用解决方案》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、鼎铭可编程交换机在ASR系统中的应用解决方案一、ASR业务介绍ASR,英文的全称是AutomatedSpeechRecognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。现在ASR技术主要被用于社会信息服务、PC、手机、车载、玩具五个领域,给人们的生产和生活带来了极大的方便。本主要讨论ASR技术在CTI行业的应用情况。基本上,语音识别是“计算机能明了人类说话的语句或命令,而做出相对的反应”。换言之,如果计算机配置

2、有“语音识别”的程序,当声音通过一个转换装置输入计算机内部、并以数位方式储存后,语音识别程序便开始以你输入的声音样本与事先储存好的声音样本进行对比工作。声音对比工作完成之后,计算机就会算出数个最匹配、接近的声音样本序号,就可以知道刚才输入的声音是什么意义,进而执行此命令。语音技术的采用,可以突破话机数字键盘的局限,降低录音和坐席成本,实现真正的自助服务。语音识别技术可以解放用户的双手,在开车时、走路时、工作忙碌时,免去按键的不便和繁琐,只要说出需求,一切就可以轻松搞定。正是由于这些优点,语音技术已经成为西方发达国家通信增值业务中的一个亮点。二、A

3、SR在CTI的应用中的构架目前,在一些行业的CTI系统应用中,为了适应某种特殊应用,或者使应用更方便、更智能,我们经常把ASR作为一个功能模块加载到CTI系统之中。通过ASR功能,可以使用户的操作更加简单,使单个用户的使用时间缩短,提高系统使用率和客户满意度。ASR服务器的核心是语音识别引擎库,语音识别引擎库由专业语音识别厂商提供。目前常见的IVR系统大都是通用的工控机平台上插入语音板卡组成,部分系统支持中文语音识别ASR技术。下图为带有ASR功能的CTI系统构架图:一个典型的包含ASR服务的电话服务流程可分为:(1)用户电话拨入,系统IVR响应

4、,并提示用户说出相关语音信息。(2)IVR系统采集用户的语音信息,并形成于语音样本,把此语音样本送向ASR服务器(3)ASR服务器将送来的语音样本和服务器内存储的语音样本进行对照分析,并进行匹配。(4)ASR服务器计算和分析出同采集来的语音样本最匹配的原始语音样本,并调出与该原始语音样本相对应的执行命令信息,将该执行命令信息通过TCP通讯网络送向数据库服务器。(5)数据库服务器接收到执行命令信息后,数据库服务器调出相应的文件数据,通过TCP通讯接口将该数据发送给IVR服务器。(6)IVR服务器把数据组装成为独立的语音文件。(7)IVR服务器播放相

5、应的语音文件给电话用户。具有ASR功能的电话智能转接系统,一般具有一些下列服务流程:(1)用户电话拨入,系统IVR响应,并提示用户说出相关语音信息。(2)IVR系统采集用户的语音信息,并形成于语音样本,把此语音样本送向ASR服务器。(3)ASR服务器计算和分析出同采集来的语音样本最匹配的原始语音样本,并调出与该原始语音样本相对应的执行命令信息,将该执行命令信息通过TCP通讯网络送向IVR服务器。(4)IVR服务器将该执行命令信息转换成相应的执行命令,进行二次拨号(可能是内线也可能是外线)。(5)振铃端用户摘机,双方进行通话。一些系统综合上面两种服

6、务流程,更全面的利用ASR所带来的智能性和方便性对用户进行服务。一般的公网接入(IVR)大都采用“工控机+语音板卡”,而采集的语音样本则通过局域网传给ASR服务器。这种结构只适用于简单的应用场合。如果用这种方式去组建较大的系统,则会存在诸多问题:(一)两个瓶颈1、接入瓶颈:单台工控机的接入容量一般不超过8E1为宜。除了运行应用程序外,它还要控制两个实时端口:实时地通过局域网发送采集到的语音样本,并要实时地将采集到的语音数据通过由语音卡通过PCI(或ISA)总线传递给工控机,如下图所示。通过局域网传递语音数据本来就不能保证其时实时性,其结果就是用户

7、听到的语音经常断续,保证不了语音质量。如果传递的语音数据是经过压缩的,语音数据本来就是通过TTS进行合成的,再经过压缩,则音质会有很大的损伤,因此同样保证不了语音质量。从上图中我们可以看到,经TTS合成的语音数据从局域网经过网卡,再通过主板PCI(或ISA)总线进入语音卡,最后进入电信网,同样语音数据通过计算机主板经PCI(或ISA)总线进入语音卡也要求是实时的。这两种实时性的要求会导致在接入量比较大的情况下,会给计算机的总线造成很大的负担。因为总线的带宽(数据吞吐量)是有限的。况且其它的板卡和接口(如声卡、显示卡等)也要直接或间接地占用总线。因

8、此在接入量比较大的情况下,计算机的总线带宽会成为一个比较关键的瓶颈。即便提高语音板卡的接入能力。在有大量电话接入的情况下,由于语音数据实

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。