资源描述:
《基于DTW的俄语短指令语音识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于DTW的俄语短指令语音识别王彤马延周易绵竹中国人民解放军外国语学院语言工程系摘要:面向训练语料有限的语音识别任务,基于动态时间规整(dynamictimewarping,DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合咅字转换和机器翻译的语咅识别方法。其次,结合俄语语咅特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高
2、了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%o关键词:俄语语音识别;端点检测;DTW算法;跨语言语音识别;作者简介:王彤(1993—),女,硕士研究生,研究方向为语言信息处理.E-mail:463906155@qq.com作者简介:易绵竹(1964—),男,博士,教授,研究方向为计算语言学.E-mail:13373781261@163.com收稿日期:2017-05-20基金:国家自然科学基金重大项目(11590771)SpeechrecognitionofRussianshortinstruetionsb
3、asedonDTWWANGTongMAYan-zhouYIMian-zhuLanguageEngineeringDepartment,PLAUniversityofForeignLanguages;Abstract:Focusonspeechrecognitiontaskwithlimitedtrainingcorpus,thispapermakesresearchofRussianspeechrecognitionbasedonDTW(dynamictimewarping)algorithm.Firstly,westudymethodsforcombini
4、ngspeechrecognitionandmachinetranslationwiththespeechcorpuswhichannotatingtagsofcrosslanguagetext・Secondly,basedonthecharacteristicsofRussianspeech,inordertodetectedsyllableendpoint,wesetdynamicthresholdaccordingtothecentralvowel,whichincreasedthespeedby34.4%andincreasedtheaccuracy
5、by14%.Finally,weextracttheparametersofthestaticanddynamiccharacteristicsbyanalyzingspeechfeaturesoftimedomainandfrequencydomain.Inaddition,theDTWalgorithmisimprovedtoovercometheillconditionandreducethecomputationscalewithglobalrestrictionsandearlydiscardstrategies,whichincreasedthe
6、speedby4.8%andincreasedtheaccuracyby19.7%.ExperimentsontheRussianshortinstructionsetwith5foldcrossvalidation,andtheaccuracyofspeechrecognitionreached74.9%.Keyword:Russianspeechrecognition;endpointdetection;DTWalgorithm;crosslanguagespeechrecognition;Received:2017-05-200引言语音识别(autom
7、aticspeechrecognition,ASR)是指机器通过识别和理解过程将语咅信号转换为相应的文本或命令IH,然后根据信息内容,执行人的某种意图RL面向汉语和英语的大词汇连续语音识别在统计建模、神经网络等机器学习方法的推动H趋实用化。但针对小语种、少数民族语言、方言等资源受限语言的语音识别研究依旧廣乏RL国内对俄语语音的研究多面向汉俄语音比较及俄语语音教学,面向语言工程的研究还处于起步阶段。徐来娣[4-5]研究俄语音节理论并提岀俄语咅节切分方案,采用统计方法对比俄汉语流的重咅;赵芳丽[6-7]使用praat软件进行俄语声学特征实验分析;马延周宜采集标注
8、了360h的俄语语音语料和10G俄语文本语料,训练基