欢迎来到天天文库
浏览记录
ID:33818729
大小:400.27 KB
页数:4页
时间:2019-02-28
《基于sopc的孤立词语音识别系统的设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、应用奇葩ExampleofApplication基于SoPC的孤立词语音识别系统的设计孙玉,郭宝增(河北大学电子信息工程学院,河北保定071002)摘要:采用SoPC方法,实现了基于动态时间规整(DTW)算法的孤立词语音识别系统,该系统可以作为电器系统的语音命令控制模块使用。考虑嵌入式系统的特点,对端点检测算法和模式匹配算法进行了选择和调整。实验表明,该语音识别系统运行速度和识别准确性能够适应语音控制的要求。SoPC设计方式灵活,适合对系统进行改进升级。关键词:SoPC;NiosII;语音识别;动态时间规整中
2、图分类号:TP391文献标识码:A文章编号:1674-7720(2012)02-0074-03Designofisolated-wordspeechrecognitionsystembasedonSoPCSunYu,GuoBaozeng(CollegeofElectronicandInformationalEngineering,HebeiUniversity,Baoding071002,China)Abstract:ThissystemusestheSoPCmethodtorealizeanisolated
3、-wordspeechrecognitionsystem.ThesystemisbasedontheimprovedDTWalgorithm,anditcanbeeasilyintegratedintoothersystems.Theendpointdetectionalgorithmandpatternrecognitionalgorithmareselectedandmodified.Thespeedandaccuracyofthesystemcansatisfytheneedsofvoicecontro
4、l.BySoPCtechnology,thesystemisflexibleandeasytobemodifiedfordifferentapplications.Keywords:SoPC;NiosII;speechrecognition;DTW随着计算机技术、模式识别技术等的发展,国内外可编程片上系统SoPC(SystemonProgrammableChip)对语音识别的研究也不断进步。目前电器、家居智能化是Altera公司提出的一种基于FPGA的嵌入式系统解决的实际需求使得语音识别技术成为一个研究热点。
5、例方法,采用软硬件结合设计的思想,实现方式简单灵活[1]。如,美国约翰·霍普金斯大学语言和语音处理中心多年设计中采用高性价比的EP2C70FPGA芯片。实验结果来一直致力于推动语言和语音识别的研究和教育,CLSP表明,系统运行良好,能够满足中、小词汇量孤立词语音每年一度的夏季研讨会对语音识别的各个领域都产生识别系统的要求。了深远的影响。国内,中国科学院等也在语音识别领域1设计方案语音信号有较大进展。语音识别系统的逻预处理相对于基于PC机平台的大词汇量语音识别系统,辑流程如图1所示。采样嵌入式系统中要求语音控制
6、模块占用资源少,功能简得到的语音信号要经过端点检测洁,可作为独立的语音识别系统或其他系统的语音控制预处理、端点检测、特征特征提取部分。因此,根据语音识别系统的准确性、实时性的要求参数提取,然后根据用户和SoPC实现方式的特点,在介绍实现该语音识别系统指定的工作模式(识别模训练模式系统模式判别的基本流程的基础上着重探讨以下两部分内容:(1)由于式或训练模式),进行模训练端点检测算法对识别的准确性影响较大,本系统探索适式匹配并输出识别结果,识别模式合SoPC设计的端点检测算法,从而使得系统的识别准或者训练得到该词
7、条的模式匹配参考模板确性有所改进;(2)模式匹配时,对同一模板采用了多个模板,并存入模板库。因局部判决函数,求多个累加总距离的平均值作为最终的识别结果此,在硬件资源允许的条判决依据,进一步提高了识别结果的可靠性。件下,用户可以自定义训图1语音识别系统逻辑流程图74《微型机与应用》2012年第31卷第2期应用奇葩ExampleofApplication练模板,更新模板库,拓展系统的应用范围。析,目的是提取合适的语音特征参数,使特征向量序列1.1预加重和端点检测在语音识别时,类内距离尽量小,类间距离尽量大。特征系
8、统采用8kHz采样,由音频编/解码芯片WM8731参数的提取同样是语音识别的关键问题,特征参数的选采样得到的语音数据,经过FIFO数据缓存器传输到系择直接影响到语音识别的精度。结合SoPC设计的需求,选择提取语音信号的美尔特征参数(MFCC)[3]。MFCC能统的SDRAM中,然后对SDRAM中的数据进行后续处理。设定256个采样点作为一帧,每个孤立词采集100够较好地反映人耳的听觉特性。帧(3.2
此文档下载收益归作者所有