基于DTW的俄语短指令语音识别

基于DTW的俄语短指令语音识别

ID:47659177

大小:264.46 KB

页数:18页

时间:2019-10-18

基于DTW的俄语短指令语音识别_第1页
基于DTW的俄语短指令语音识别_第2页
基于DTW的俄语短指令语音识别_第3页
基于DTW的俄语短指令语音识别_第4页
基于DTW的俄语短指令语音识别_第5页
资源描述:

《基于DTW的俄语短指令语音识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于DTW的俄语短指令语音识别王彤马延周易绵竹中国人民解放军外国语学院语言工程系摘要:面向训练语料有限的语音识别任务,基于动态时间规整(dynamictimewarping,DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合咅字转换和机器翻译的语咅识别方法。其次,结合俄语语咅特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高

2、了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%o关键词:俄语语音识别;端点检测;DTW算法;跨语言语音识别;作者简介:王彤(1993—),女,硕士研究生,研究方向为语言信息处理.E-mail:463906155@qq.com作者简介:易绵竹(1964—),男,博士,教授,研究方向为计算语言学.E-mail:13373781261@163.com收稿日期:2017-05-20基金:国家自然科学基金重大项目(11590771)SpeechrecognitionofRussianshortinstruetionsb

3、asedonDTWWANGTongMAYan-zhouYIMian-zhuLanguageEngineeringDepartment,PLAUniversityofForeignLanguages;Abstract:Focusonspeechrecognitiontaskwithlimitedtrainingcorpus,thispapermakesresearchofRussianspeechrecognitionbasedonDTW(dynamictimewarping)algorithm.Firstly,westudymethodsforcombini

4、ngspeechrecognitionandmachinetranslationwiththespeechcorpuswhichannotatingtagsofcrosslanguagetext・Secondly,basedonthecharacteristicsofRussianspeech,inordertodetectedsyllableendpoint,wesetdynamicthresholdaccordingtothecentralvowel,whichincreasedthespeedby34.4%andincreasedtheaccuracy

5、by14%.Finally,weextracttheparametersofthestaticanddynamiccharacteristicsbyanalyzingspeechfeaturesoftimedomainandfrequencydomain.Inaddition,theDTWalgorithmisimprovedtoovercometheillconditionandreducethecomputationscalewithglobalrestrictionsandearlydiscardstrategies,whichincreasedthe

6、speedby4.8%andincreasedtheaccuracyby19.7%.ExperimentsontheRussianshortinstructionsetwith5foldcrossvalidation,andtheaccuracyofspeechrecognitionreached74.9%.Keyword:Russianspeechrecognition;endpointdetection;DTWalgorithm;crosslanguagespeechrecognition;Received:2017-05-200引言语音识别(autom

7、aticspeechrecognition,ASR)是指机器通过识别和理解过程将语咅信号转换为相应的文本或命令IH,然后根据信息内容,执行人的某种意图RL面向汉语和英语的大词汇连续语音识别在统计建模、神经网络等机器学习方法的推动H趋实用化。但针对小语种、少数民族语言、方言等资源受限语言的语音识别研究依旧廣乏RL国内对俄语语音的研究多面向汉俄语音比较及俄语语音教学,面向语言工程的研究还处于起步阶段。徐来娣[4-5]研究俄语音节理论并提岀俄语咅节切分方案,采用统计方法对比俄汉语流的重咅;赵芳丽[6-7]使用praat软件进行俄语声学特征实验分析;马延周宜采集标注

8、了360h的俄语语音语料和10G俄语文本语料,训练基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。