基于支持向量机的语种识别方法.ppt

基于支持向量机的语种识别方法.ppt

ID:56468914

大小:352.50 KB

页数:15页

时间:2020-06-19

基于支持向量机的语种识别方法.ppt_第1页
基于支持向量机的语种识别方法.ppt_第2页
基于支持向量机的语种识别方法.ppt_第3页
基于支持向量机的语种识别方法.ppt_第4页
基于支持向量机的语种识别方法.ppt_第5页
资源描述:

《基于支持向量机的语种识别方法.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于支持向量机的 语种识别方法2005.12.8报告提纲支持向量机的原理广义线性区分序列核函数基于支持向量机的语种识别系统其他支持向量机的原理在低维特征空间,线性支持向量机:线性可分和线性不可分svsv支持向量机原理通过一个非线性函数ф将低维特征空间的数据x映射到高维特征空间,从而把线性不可分的数据在高维空间转化为线性可分;非线性支持向量机:线性可分和线性不可分支持向量机核函数上述式子中,称为核函数,常见的有4种核函数:采用拉格朗日乘子法求解上述二次规划问题,得到对偶最优化问题如下:核函数特征映射原理以多项式核函数为例,假设多项式的阶数q=

2、2,每帧的特征向量为2维这样,就把特征向量由2维空间映射到了6维空间,这个过程等价于:使用多项式展开公式先把特征向量映射到6维空间,然后使用线性核函数做内积,即上述4种核函数用于语种识别或说话人识别存在的问题假设有两个说话人(或两个语种),每个说话人有训练样本(每帧的特征向量)100个,假设在低维空间这200个样本不可分,那么我们是否可以把这些低维空间的样本通过核函数映射到高维空间进行区分呢?答案是否定的,这主要基于两点主要原因:由于帧与帧特征向量之间没有很好的区分性,所以当两类的训练帧很多时(达到上万个,并不仅限于这200个),支持向量机

3、训练通常会失效;上述方法是基于一种假设,其假设每帧之间是独立的,不相关的,其忽略了帧与帧之间的连续性和相关性;正是基于以上两点原因,我们需要找到一种新的核函数,其能够对帧与帧之间的相关性建模,换句话说,应该能够把一定时长的序列(包含很多帧)数据转换成一个特征向量,并把该特征向量映射到高维空间,由此提出了广义线性判别序列核函数(GeneralizedLinearDiscriminantSequenceKernel)。广义线性判别序列核函数假设有一个句子,其包括N帧,当把每帧特征向量使用多项式展开公式ф映射到高维空间之后,对某个分类器模型w来说

4、,得到广义线性判别函数的输出概率可以用下式表示:怎么得到模型w呢?可以使用最小平方误差准则(MSE)训练得到。假设训练时该说话人训练样本xi(帧数)有N1个,背景说话人训练样本yi有N2个,该说话人的理想输出为1,背景说话人的理想输出为0,那么寻找w的过程相当于求解下列最优化问题的最优解:求解过程如下:广义线性判别序列核函数把(3)式求得的w代入(1)式,并考虑先验概率,得到:因此,对于任意两个序列X=[x1,x2,…,xn1],Y=[y1,y2,…,yn2],可以构造如下核函数:基于支持向量机的语种识别系统系统框架训练过程测试过程SDC特

5、征识别系统框架训练时,语音信号经过特征提取和预处理(把静音帧去掉)之后,使用多项式变换和映射方法,可以把若干低维的帧(Frame)特征向量扩展成几个高维的序列(Sequence)特征向量,然后借助GLDS核函数,使得这些高维的序列特征向量带有区分性,以此训练各语种的SVM模型;测试时,测试句子同样经过特征提取和预处理之后,映射到高维特征向量空间,再由各语种的SVM模型计算得分概率,选取得分最大的模型所对应的语种为所识别的语种。语种模型训练过程假设by是测试句子使用多项式展开特征映射之后的序列向量,那么SVM的输出分数可以用下式表示:测试过程

6、由于各个语种模型仅仅是一个向量,所以计算模型的概率得分相当于对特征序列向量和模型向量做一次内积计算,所以识别速度很快。其他系统使用了多项式展开算法,从而把低维特征扩展映射到高维空间,对于p阶多项式来说,其可以把N维特征向量映射到维空间,也就是说,式子展开将有项,下面是多项式阶数p=3和特征维数N的一个简单对应表:系统中使用的多项式展开算法比较耗时,从而大大影响了训练速度。N121324263639494555602925365491391148022100谢谢!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。