欢迎来到天天文库
浏览记录
ID:31377529
大小:106.00 KB
页数:5页
时间:2019-01-09
《语音识别的svm模型选择分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、语音识别的SVM模型选择分析 摘要:针对现有SVM模型选择方法中,人为指定核函数类型可能使得SVM性能难以达到最优化,分析了现有核函数类型对语音分类率的影响。并把K-交叉验证思想与网格搜索法、遗传算法、粒子群优化算法相结合进行参数寻优,应用到语音识别中。并对语音特征数据处理问题进行了研究。分析结果表明[-1,1]内对语音特征参数归一化,且采用径向基核函数、网格搜索法对参数寻优,能达到最优的语音分类率。 关键词:语音识别;语音特征参数;SVM(支持向量机);模型选择;归一化;交叉验证 中图分类号:TP18文献标识码:A文章编号:1009-3044(2015)25-0133-02 Sp
2、eakerRecognitionModelSelectionAnalysisBasedonSVM ZHAOHai-jun (CollegeofInformation,ShanxiAgriculturalUniversity,Taigu030800,China) Abstract:ForexistingSVMmodelselectionmethod,specifiedthetypeofman-madekernelmaymakeitdifficulttooptimizetheperformanceofSVM,itanalysestheimpactofexistingkerneltypet
3、ospeechclassification.CombiningK-foldcrossvalidationwithgridsearchingandGAandPSOareusedparameteroptimizationin5speechrecognition.Alsoitstudiesspeechcharacteristicprocessingproblem.Analysisresultsshowthatthenormalizationof[-1,1]andusingRadialBasisFunction(RBF)andgridsearchingcanachievethebestspeech
4、classificationrate. Keywords:speakerrecognition;voicefeatureparameter;SupportVectorMachine(SVM);modelselection;normalization;crossvalidation 1概述 语音识别(speakerrecognition,SR)技术(也成声纹识别技术),是生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术[1]。语音识别技术的核心是通过预先录入说话人的样本,提取说话人独一无二的语音特征并保存在数据库中,应用时将待验证的声
5、音和数据库中的特征进行匹配,从而决定说话人的身份。语音识别技术以其独特的方便性、经济性和准确性受到世人瞩目。 在语音识别中最常用的特征参数是基于声道的LPCC、运用基于等响度曲线和临界带的PLP以及基于听觉特性的MFCC[2-3],本文选取MFCC特征进行仿真实验。首先分析了对特征参数的预处理问题,接着将现有的核函数类型对语音分类率的影响作了分析,然后还对分类器训练中惩罚因子c和核函数参数[γ]进行优化,从而来提高语音分类率。 2支持向量机原理5 对于非线性可分问题,SVM的基本思想是:利用核函数将输入特征的样本点映射到高维特征空间中,数据被超平面分割,在高维空间中变得线性可分,转化
6、为线性可分模式,然后再对应于低维空间的非线性分类[4]。 对于线性可分模式,考虑训练样本[xi,yiNi=1],其中[xi]是输入模式的第[i]个样本,[yi∈-1,+1]。设用于分离的超平面:[w?x+b=0]其中w是超平面的法向量,b是超平面的常数项。SVM的主要思想是建立一个超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。即最优分类超平面等价于求最大间隔。满足下面条件的特殊数据点[xi,yi]称为支持向量:[w?xi+b=-1,yi=-1]or[w?xi+b=1,yi=1]。支持向量是那些最靠近决策面的数据点。 3实验结果与分析 TimitDatabase语音数据库中
7、,选取6个不同男性的声音,都是说的相同的话。对每个语句提取相应的MFCC参数,且选取前400组变换参数数据,其中350组样本数据作为实验训练样本,50组样本数据作为实验测试样本。识别模型为SVM支持向量机;MFCC特征维数为20;mel滤波器的组数为24;测试人数:2、4、6人;测试次数:每次识别运行10次。 实验1 本实验部分采用SVM默认下径向基核函数,用不同归一化方式[5]作对比,最后测试集预测分类准确率如表1
此文档下载收益归作者所有