语音识别的svm模型选择分析

语音识别的svm模型选择分析

ID:31377529

大小:106.00 KB

页数:5页

时间:2019-01-09

语音识别的svm模型选择分析_第1页
语音识别的svm模型选择分析_第2页
语音识别的svm模型选择分析_第3页
语音识别的svm模型选择分析_第4页
语音识别的svm模型选择分析_第5页
资源描述:

《语音识别的svm模型选择分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、语音识别的SVM模型选择分析  摘要:针对现有SVM模型选择方法中,人为指定核函数类型可能使得SVM性能难以达到最优化,分析了现有核函数类型对语音分类率的影响。并把K-交叉验证思想与网格搜索法、遗传算法、粒子群优化算法相结合进行参数寻优,应用到语音识别中。并对语音特征数据处理问题进行了研究。分析结果表明[-1,1]内对语音特征参数归一化,且采用径向基核函数、网格搜索法对参数寻优,能达到最优的语音分类率。  关键词:语音识别;语音特征参数;SVM(支持向量机);模型选择;归一化;交叉验证  中图分类号:TP18文献标识码:A文章编号:1009-3044(2015)25-0133-02  Sp

2、eakerRecognitionModelSelectionAnalysisBasedonSVM  ZHAOHai-jun  (CollegeofInformation,ShanxiAgriculturalUniversity,Taigu030800,China)  Abstract:ForexistingSVMmodelselectionmethod,specifiedthetypeofman-madekernelmaymakeitdifficulttooptimizetheperformanceofSVM,itanalysestheimpactofexistingkerneltypet

3、ospeechclassification.CombiningK-foldcrossvalidationwithgridsearchingandGAandPSOareusedparameteroptimizationin5speechrecognition.Alsoitstudiesspeechcharacteristicprocessingproblem.Analysisresultsshowthatthenormalizationof[-1,1]andusingRadialBasisFunction(RBF)andgridsearchingcanachievethebestspeech

4、classificationrate.  Keywords:speakerrecognition;voicefeatureparameter;SupportVectorMachine(SVM);modelselection;normalization;crossvalidation  1概述  语音识别(speakerrecognition,SR)技术(也成声纹识别技术),是生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术[1]。语音识别技术的核心是通过预先录入说话人的样本,提取说话人独一无二的语音特征并保存在数据库中,应用时将待验证的声

5、音和数据库中的特征进行匹配,从而决定说话人的身份。语音识别技术以其独特的方便性、经济性和准确性受到世人瞩目。  在语音识别中最常用的特征参数是基于声道的LPCC、运用基于等响度曲线和临界带的PLP以及基于听觉特性的MFCC[2-3],本文选取MFCC特征进行仿真实验。首先分析了对特征参数的预处理问题,接着将现有的核函数类型对语音分类率的影响作了分析,然后还对分类器训练中惩罚因子c和核函数参数[γ]进行优化,从而来提高语音分类率。  2支持向量机原理5  对于非线性可分问题,SVM的基本思想是:利用核函数将输入特征的样本点映射到高维特征空间中,数据被超平面分割,在高维空间中变得线性可分,转化

6、为线性可分模式,然后再对应于低维空间的非线性分类[4]。  对于线性可分模式,考虑训练样本[xi,yiNi=1],其中[xi]是输入模式的第[i]个样本,[yi∈-1,+1]。设用于分离的超平面:[w?x+b=0]其中w是超平面的法向量,b是超平面的常数项。SVM的主要思想是建立一个超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。即最优分类超平面等价于求最大间隔。满足下面条件的特殊数据点[xi,yi]称为支持向量:[w?xi+b=-1,yi=-1]or[w?xi+b=1,yi=1]。支持向量是那些最靠近决策面的数据点。  3实验结果与分析  TimitDatabase语音数据库中

7、,选取6个不同男性的声音,都是说的相同的话。对每个语句提取相应的MFCC参数,且选取前400组变换参数数据,其中350组样本数据作为实验训练样本,50组样本数据作为实验测试样本。识别模型为SVM支持向量机;MFCC特征维数为20;mel滤波器的组数为24;测试人数:2、4、6人;测试次数:每次识别运行10次。  实验1  本实验部分采用SVM默认下径向基核函数,用不同归一化方式[5]作对比,最后测试集预测分类准确率如表1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。