利用独立分量分析法提取语音特性

利用独立分量分析法提取语音特性

ID:38291672

大小:176.00 KB

页数:7页

时间:2019-06-07

利用独立分量分析法提取语音特性_第1页
利用独立分量分析法提取语音特性_第2页
利用独立分量分析法提取语音特性_第3页
利用独立分量分析法提取语音特性_第4页
利用独立分量分析法提取语音特性_第5页
资源描述:

《利用独立分量分析法提取语音特性》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、利用独立分量分析法提取语音特性在此文中,我们提出一种新的利用独立分量分析法的讲话的语音特性。独立分量分析方法提供语音信号适合的Gabor-like特性的基本函数的有效编码。基础函数有些冗余,所以我们利用排列方法选择一些基本函数。基本函数在低频基本矢量到高频基本矢量几乎都是有规律的。这也和人类的实际语音信号在低频段有较多信息是相一致的。这些特性能够被应用到自动语音识别系统中,而这种新的方法比常规的melfrequencycepstralfeatures方法有更快的识别速度。一、导言语音信号是composedofindependenthigherorderstatisticalc

2、haracteristics.独立分量分析方法已经基于higherorderstatistics从自然的语音信号和音乐声中提取特征向量[1],[2]。这些特性是时域和频域同时起作用的。然而,没有人类语音的特性被提取用作语音识别。在本文中,我们将叙述从人类语音中提取ofGabor-likefeatures。提取语音特性很像一个有窄带宽度和中心频率的带通滤波器。带通滤波器用数学处理方法设计成有中等大小的中心频率,而他们的带宽也取决于一个特定的数学工具。在听觉特性提取处理中,滤波器的作用就和耳膜的作用一样.在内耳的耳蜗,语音信号引起耳膜上的mechnical的振动。耳膜的不同的局部

3、的振动是对不同频率的语音信号的反应。然后在听觉中基于特征处理的每个带通滤波器都耳膜的频率特性为模型。另外一方面,在这篇文章中摆列基本矢量反映输入语音统计特性比其他滤波的方法都好。对于有时的结构设计,提取特性系数矢量被用于行列基本矢量中。最后,对ICA-basedfeatures识别速率与mel-frequencycepstralcoefficients(MFCCs)做一个对比。二、用ICA提取语音特性为了从语音信号中提取独立分量特性矢量,ICA算法应用了很多人类的语音片断。一个ICA网络是为了获得独立分量u从语音片断x中,还有从x中用顺序分量矩阵W取出基本函数系数u。ICA假

4、设x是独立分量u的线性混合。如果A代表W的逆矩阵那么A的列表示x的基本特性矢量。为了提取基本函数一必须利用混合矩阵A或者分离矩阵W,所以我们用混合矩阵W。图一:基本向量ICA网络图已知的准则是基于最大互信息量H(y),可以表示成[3](1)(2)这里p(u)代表语音信号的近似概率密度函数,。这里g(u)是一个非线性函数,它近似于语音信号u的积累分配函数[3]。自然梯度被引入来改善收敛速度,特别是这种方法不要求逆矩阵W,还提供了一下的规则:(3)这里是源信号的概率密度函数,被叫做scorefunction.用已经知道(3)式的规则,W被反复用梯度上升的方法校正只到达到收敛,让我

5、们令N是随机发生语音信号片断的尺寸。图一所示的基本向量工作网络图。ICA网络是composed输入N和输出N,N基本向量是由矩阵A()从N中产生的。一、SELECTIONOFDOMINANTFEATUREVECTORS为了语音识别,我们可能要从基本向量N中选择主要特征向量。ICA算法从繁多的输入信号中找出独立分量,可能这样的结果时会有多余的分量混在其中。为了减少这种分量,几个技术已经被提出[5]。图形二:(a)规则的非混合矩阵W列向量,(b)频谱在本文中,基本向量在语音信号和基本向量系数的可变性中的贡献是要被尊重的。尊重的意思就是基本向量在语音信号中的强大作用,能表示基本向量

6、的重要关系。因此,从基本向量N规责的,M的主要特征能被选择出来。可变性表示了基本向量系数的变化,而这就是基本向量和语音信号识别的重要关系的表现。图4(a)所示的基本函数重先排序,(b)表示相应的基本向量的系数系数可变性。Onecanseethosetwoorderingmethodsprovidealmostsamebasisvectororderandbasisvectorsafterabout30tharenegligibleinbothcontributionandvariability.TheobtainedMfeaturevectorsconstitutetheM-

7、channelfilter-bank,andprovideaspectralvectoreverytimeframe.图3:(a)基本向量的排列(b)频谱一、真实数据和识别实验为了从人类的语音信号中获得基本向量,75种口音和59个人被用来完成这个实验。Speechsegmentscomposedof50samples,i.e.,3.lmstimeintervalatI6kHzsamplingrates,wererandomlygenerated.Totalsegmentsweregenerated,an

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。