语音识别的svm模型选择分析

ID：31377529

大小：106.00 KB

页数：5页

时间：2019-01-09

资源描述：

《语音识别的svm模型选择分析》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、语音识别的SVM模型选择分析　　摘要：针对现有SVM模型选择方法中，人为指定核函数类型可能使得SVM性能难以达到最优化，分析了现有核函数类型对语音分类率的影响。并把K-交叉验证思想与网格搜索法、遗传算法、粒子群优化算法相结合进行参数寻优，应用到语音识别中。并对语音特征数据处理问题进行了研究。分析结果表明[-1，1]内对语音特征参数归一化，且采用径向基核函数、网格搜索法对参数寻优，能达到最优的语音分类率。　　关键词：语音识别；语音特征参数；SVM（支持向量机）；模型选择；归一化；交叉验证　　中图分类号：TP18文献标识码：A文章编号：1009-3044（2015）25-0133-02　　Sp

2、eakerRecognitionModelSelectionAnalysisBasedonSVM　　ZHAOHai-jun　　（CollegeofInformation，ShanxiAgriculturalUniversity，Taigu030800，China）　　Abstract：ForexistingSVMmodelselectionmethod，specifiedthetypeofman-madekernelmaymakeitdifficulttooptimizetheperformanceofSVM，itanalysestheimpactofexistingkerneltypet

3、ospeechclassification.CombiningK-foldcrossvalidationwithgridsearchingandGAandPSOareusedparameteroptimizationin5speechrecognition.Alsoitstudiesspeechcharacteristicprocessingproblem.Analysisresultsshowthatthenormalizationof[-1，1]andusingRadialBasisFunction（RBF）andgridsearchingcanachievethebestspeech

4、classificationrate.　　Keywords：speakerrecognition；voicefeatureparameter；SupportVectorMachine（SVM）；modelselection；normalization；crossvalidation　　1概述　　语音识别（speakerrecognition，SR）技术（也成声纹识别技术），是生物认证技术的一种，是一项根据语音波形中反映说话人生理和行为特征的语音参数，自动识别说话人身份的技术[1]。语音识别技术的核心是通过预先录入说话人的样本，提取说话人独一无二的语音特征并保存在数据库中，应用时将待验证的声

5、音和数据库中的特征进行匹配，从而决定说话人的身份。语音识别技术以其独特的方便性、经济性和准确性受到世人瞩目。　　在语音识别中最常用的特征参数是基于声道的LPCC、运用基于等响度曲线和临界带的PLP以及基于听觉特性的MFCC[2-3]，本文选取MFCC特征进行仿真实验。首先分析了对特征参数的预处理问题，接着将现有的核函数类型对语音分类率的影响作了分析，然后还对分类器训练中惩罚因子c和核函数参数[γ]进行优化，从而来提高语音分类率。　　2支持向量机原理5　　对于非线性可分问题，SVM的基本思想是：利用核函数将输入特征的样本点映射到高维特征空间中，数据被超平面分割，在高维空间中变得线性可分，转化

6、为线性可分模式，然后再对应于低维空间的非线性分类[4]。　　对于线性可分模式，考虑训练样本[xi，yiNi=1]，其中[xi]是输入模式的第[i]个样本，[yi∈-1，+1]。设用于分离的超平面：[w?x+b=0]其中w是超平面的法向量，b是超平面的常数项。SVM的主要思想是建立一个超平面作为决策曲面，使得正例和反例之间的隔离边缘被最大化。即最优分类超平面等价于求最大间隔。满足下面条件的特殊数据点[xi，yi]称为支持向量：[w?xi+b=-1，yi=-1]or[w?xi+b=1，yi=1]。支持向量是那些最靠近决策面的数据点。　　3实验结果与分析　　TimitDatabase语音数据库中

7、，选取6个不同男性的声音，都是说的相同的话。对每个语句提取相应的MFCC参数，且选取前400组变换参数数据，其中350组样本数据作为实验训练样本，50组样本数据作为实验测试样本。识别模型为SVM支持向量机；MFCC特征维数为20；mel滤波器的组数为24；测试人数：2、4、6人；测试次数：每次识别运行10次。　　实验1　　本实验部分采用SVM默认下径向基核函数，用不同归一化方式[5]作对比，最后测试集预测分类准确率如表1

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

语音识别的svm模型选择分析

语音识别的svm模型选择分析

相关文章

相关标签