基于语音识别系统中dtw算法改进技术研究

基于语音识别系统中dtw算法改进技术研究

ID:34124780

大小:310.96 KB

页数:3页

时间:2019-03-03

基于语音识别系统中dtw算法改进技术研究_第1页
基于语音识别系统中dtw算法改进技术研究_第2页
基于语音识别系统中dtw算法改进技术研究_第3页
资源描述:

《基于语音识别系统中dtw算法改进技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、您的论文得到两院院士关注模式识别文章编号:1008-0570(2006)02-2-0267-03基于语音识别系统中DTW算法改进技术研究DiscussionofDTWProgrammingImprovedWayOnSpeechRecognition(重庆三峡学院)陈立万Chen,Liwan摘要:动态时间规整(DynamicTimeWarping)是语音识别中的一种经典算法,由于算法简单又有效,因此在实现孤立词识别系统中获得了广泛的应用,但仍然存在一些不足,本文从提高识别率和识别速度入手提出对DTW算法进行改进研究,以达到更满意的语音识别效果。关

2、键词:语音识别;端点检测;DTW算法中图分类号:TP391.42文献标识码:AAbstract:DynamicTimeWarpingisakindofclassicalprogramminginspeechrecognitionsystem,becausetheprogrammingissim-pleandvalid,therefore,itisachievedextensiveapplicationinspeechrecognitionofsingleword,buttherearesomequestions,thepaperraisesim

3、provedwaysfromhighdistinguishablerateandspeed,sothatitwillattainsatisfiedeffectinspeechrecognition.Keyword:SpeechRecognitionBeginningInspectDTWProgramming技其中模式识别部分是将输入语音特征参数信息术引言与训练时预存的参数模型(或模板)进行比较匹配,可通过语音传递信息是人类最重要,最有效和最方用DTW技术法(或HMM法),这里着重讨论DTW技创便的交换信息的形式,语音识别主要指让机器转达人术方法

4、,它是把时间规整和距离测度计算结合起来的说的话,即在各种情况下,准确地识别出语音的内容,一种非线性规整技术,DTW算法的质量就是运用动态新从而根据其信息,执行人的各种意图。孤立词识别系规划的思想,利用局部最佳化的处理来自动寻找一条统就是识别孤立发音的词,DTW是把时间规整和距离路径,两个特征矢量之间的积累失真量最小,从而避测度计算结合起来的一种非线性规整技术,它尽管对免由于时长不同而可能引入的误差。即寻找一个规整大词汇量、连续语音、非特定人语音识别效果较差,但函数im=f(in),将测试矢量的时间轴n非线性地映射对孤立词语音识别,DTW算法较为

5、简洁,正确识别率到参考模板的时间轴m上,并使该函数满足:也较高,因此,DTW算法在孤立词语音识别系统有较N广泛的应用,因而对其进一步的研究以提高其正确识D=minåd(T(in),R(f(im))。其中D是处于最优时间in=1别速度具有很强的实用价值。规整情况下两矢量的距离,参数模板有M帧矢量1孤立词语音识别系统{R(1)...R(M)},测试模板有N帧矢量{T(1)...T(N)},d(T(in),R(im))是在(in,im)平面上矩形参考模板与测试模孤立词识别系统,一般是以孤立词为识别单位,板之间的畸变度量,即表示T中的第in帧特征与R中

6、即直接取孤立词为识别基元,孤立词语音识别系统流N程可用下列框图(1)表示:的第im帧特征之间的畸变度量,其中in=im。M!"#$端点检测的目的是从包含语音的一般信号中确!"#$%定出语音的起点以及终点,有效的端点检测不仅能使处理时间最小,而且能排除无声段的噪声干扰,从而!"#$使识别系统具有良好的识别性能,端点检测的成功与否甚至在某种程度上直接决定了整个语音识别系统!"#$的成败。在孤立词语音识别系统中,识别精度和计算复杂!"#$!"#$!"#!"#$!"#$%度的降低(提高识别速度)是主要的指标,要解决这两个问题关键是特征的选择和提取,失真

7、测度的选择以图1语音识别系统框图及匹配算法的有效性。下面就如何提高识别精度和识别速度进行讨论.陈立万:副教授《嵌入式系统应用精选200例》邮局订阅号:82-946360元/年-267-模式识别中文核心期刊《微计算机信息》(嵌入式与SOC)2006年第22卷第2-2期xpx2DTW算法改进技术②ab时比较分三段:ì11、端点检测ïx®2x2x£xïa(1)双门限端点检测ï111íx®x+(M-N)xapx£xb用两个门限进行端点检测,高门限被超过基本值ï22211xfxb可以确定语音的起点端点,低门限用于确定语音真正ï2x+(M-2N)®x+(M

8、-N)ïî22的起点端点,但只是低门限被成功检测未必就是语音③当xafxb时:的起始端点,也有可能是短时的噪音;当高门限已经确ì1定语音起始端点后,再

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。