非特定人语音识别(asr)嵌入式解决方案

非特定人语音识别(asr)嵌入式解决方案

ID:15030752

大小:43.00 KB

页数:4页

时间:2018-08-01

非特定人语音识别(asr)嵌入式解决方案_第1页
非特定人语音识别(asr)嵌入式解决方案_第2页
非特定人语音识别(asr)嵌入式解决方案_第3页
非特定人语音识别(asr)嵌入式解决方案_第4页
资源描述:

《非特定人语音识别(asr)嵌入式解决方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、非特定人语音识别(ASR)嵌入式解决方案国家/地区︰上海市上海市区联系电话︰13918041362联系人︰郑先生(经理)最近登入︰2009/12/24  嵌入式语音识别在消费类电子产品市场应用上大约分成三类:手提设备,游戏/玩具以及汽车。我们已经开发出能安装在智能手机Smartphone上的连续语音及短语语音识别软件:WansonASRChip1.0,它是专门为微小芯片上而开发的嵌入式语音识别引擎。,可以为用户提供语音拨号和声音命令控制等功能。这些软件可以作用在智能手机Smartphone,CDMA/2.5G/3.5G芯片,智能玩具以及汽车的导航系统上。该语

2、音识别软件兼顾到识别速度和识别准确率的平衡,能运用于一系列从语音命令控制,语音人名拨号到语音翻译,语言学习的实际应用中,使得我们的OEM伙伴能快速地推出他们的新产品。  1、WansonASRChip1.0综述:l  此引擎可以为您已有的硬件平台上(无论是16位MCU、DSP、或者ARM)上增加语音识别的功能,比如手机控制器平台。全套的解决方案包括了公司专有的非特定人语音识别引擎,不需要您现有控制器作大的硬件改动(仅需要增加音频的输入和输出电路)。l 在控制器芯片中移植非特定人语音识别引擎(标准的C语言写的代码),利用控制器芯片的运算能力完成语音识别功能,引

3、擎可以识别关键词200多条左右(可以根据控制器芯片的性能有所增加)。l 系统具有显着的抗噪性能,在30分贝下,基本上能够完全识别,在30到50分贝的较吵的环境中,也能保持在90%以上的识别率; 2、WansonASRChip1.0 系统           2、1系统框图及概述         WansonASRChip1.0是一套功能强大,具有全部开发工具的语音识别系统,使开发者可以方便而快速地开发出一系列不同的应用。WansonASRChip1.0提供的特性包括有: ·该语音识别软件附带了一系图形化界面的软件开发包,使厂商可以很快在现有的产品上增加语音识

4、别功能; ·秉承WansonASR电信级语音识别软件的高准确率和稳定性,持续提高客户意度; ·软件采用标准C书写核心算法,使得该软件能很快地移植到其他操作系统和处理器上; ·提供了常规的,功能强大的API接口,能够很方便地与设备上的现有软件集成. 2.2 应用程序开发  开发具有嵌入式语音识别功能的应用程序大约需要以下的步骤:  ·性能的定义  开发商在开发应用程序时,首先要定义的是准备给用户提供什么样的特性和功能。例如,唤醒功能(该引擎可以使产品工作在待机状态,等待清晰的唤醒命令,启动语音识别软件工作)等等;  ·现有硬件环境分析  定义完性能之后,需要结

5、合现有设备的硬件条件分析能否支持上述性能的实现。如果必须的话,是否需要另加RAM和ROM,或者提高CPU的速度;  ·用户界面的设计  因为是基于消费类电子产品开发的应用程序,用户界面是否友好事关重大。WansonASRChip1.0  提供了一系列的开发包模拟运行环境,可以不断调试,只到满意为止;  ·开发  以上所有步骤完成之后,可以进行代码编写和集成的工作。   3 硬件环境     WansonASRChip1.0是模块式的系统体系,单处理器处理所有模块程序的运行。    CPU的运算能力,一般而言,在不同的系统配置下,需要做到实时识别并且不影响其他

6、任务执行所需要的最低配置为6MIPS(取决于识别词汇量大小和硬件配置等)。     RAM和ROM需求    对于嵌入式的语音识别系统,RAM和ROM的大小需求是由应用系统的功能设计所决定的。同时,不同的RAM和ROM大小又影响着识别的准确率和响应速度。一般情况下,较大的RAM和ROM存储空间和快速的RAM和ROM速度更有利于识别速度和识别准确率的提高。更多的情况下,在实际应用中,考虑到性能价格比,一般会选择适当的RAM和ROM尺寸以达到速度和识别率的平衡。 功能 描述 ROM大小要求 RAM大小要求 语音识别离线语法生成 适用于语音命令控制等不需要动态语法

7、生成的应用程序 200k 150k  语音识别在线 适用于语音命令控制、语音拨号等需要动态语法生成的应用程序 300k 200k语法生成 语音识别在线语法生成、语音合成适用于语音命令控制、语音拨号等需要动态语法生成的应用程序并提供完整语音合成方案 500k 250k        表中所列的RAM和ROM的空间需求是一个近似数字               4 功能及特性  WansonASRChip1.0  嵌入式语音识别系统提供了一系列独到的功能和特性,以适应不同的开发厂商的需求。  * 话者独立 该软件无需事先对用户的语音训练,任何人拿起来均可使用; 

8、 * 独特的口音的处理技术 用户不用说播音员般标准的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。