资源描述:
《大词汇连续汉语语音的mlp声学特征的研究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、吻合器经腹联合断流术56例疗效分析[摘要]目的总结56参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(H丽)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练G酮参数模型。实验结果表明,差异特征的GMH画的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,
2、构成MLPs特征流重建GMH丽,系统的错字率(CER)有2%〜%的明显改善。关键词:多层感知器;差异特征;隐马尔可夫;高斯混合模型分类号:TN912文献标识码:A文章编号:1009-3044(XX)13-3470-02MLPFeaturesforLargeVocabularyContinuousMandarinSpeechRecognitionSystemLVDan-jul,Ch.Plahl2,(ScienceDept.,SouthwestForestryUniversity,Kunming650224,Chin
3、a;Furlnformatik6-ComputerScienceDepartmentRWTHAachenUniversity,Aachen52056,Germany)Abstract:TypicallyHiddenMarkovModel(HMM)iniargevocabularycontitionsystem(LVCSR)ousticfeaturesvectutfeaturestotheGauGMM),hasachievedgots.However,fortheprmfeaturesondiscriworkmul
4、tilayerperctoproducetwotypesoturesHATsandTANDEMures,andrespectivegGMMparametermodelmentalresultsshowtRsystembasedondiscissuperiortothesysdontheshort-termfeprovethesystemrecotypesofdiscriminatTANDEMarecombinedaretrainGMHMM,thatlinuousspeechrecogn,usingshort-te
5、rmacors(MFCC/PLP)asinpssianmixturemodel(odrecognitionresulooroftheseshort-temination,neuralneteptron(MLP)areusedfdiscriminativefeainsteadofshortfeatly,thecorrespondinsaretrained.ExperihattheG順MMtheLVCSriminativefeaturestemtraditionalbaseatures;Tofurtherimgnit
6、ionrate,thetwoivefeaturesHATsandsMLPsfeatureflowtoeadstoanabsolutereductionofthecharactererrorrate(CER)ofabout2%^%.Keywords:MLP;discriminativefeatures;HMM;GMM对语音信号特征参数的研究是建立良好的语音识别系统的基础与关键。在过去的研究中,语音识别系统的特征提取成分主要包括频谱包络预测,特别是经过某些简单变化后的特征,目前前端大部分是基于短时轨迹(约10ms)信
7、号分析的美尔倒谱(MFC)或是感知线性预测(PLP)。但这些传统的短时特征参数存在着对信号变化过于敏感,不能反映连续帧之间的相关特性,区分性差等方面的不足。近年来,国外很多语音研究机构在语音信号的特征提取、声学建模方面引入了神经网络ANN,其中由Berkeley国际计算机学院(ICSI)提出用基于MLPs的特征取代传统特征,系统的识别率得到了明显改善[1-3]。基于MLPs特征的差异性的优势和GMM/H画模型的成熟性,本文提出将变换后的MLPs差异特征后验概率看作是G腿画的输入向量,重新构建GMHMM模型。实验结
8、果表明MLPs特征具有更好的特性,LVCSR的识别率得到了明显的改善。1基于MLP的差异声学特征为弥补了来自言语感知和倒谱的短时分析的不足,获取时序相关联的多帧语音信息(即音素信息),文本引入了神经网络ANN的MLP,以提取基于非短时轨迹的非传统特征。本文采用的MLP特征为HATs和TANDEM两种。长时HATs特征参数HATs特征基于人对不同频带的感觉不同,HATs特征