资源描述:
《一种改进的语音识别词错误率评估算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第34卷第1期红外与激光工程2005年2月Vol.34No.1InfraredandLaserEngineering!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Feb.2005一种改进的语音识别词错误率评估算法吴边!兰时勇!刘重庆(上海交通大学图像处理与模式识别研究所!上海200030)摘要"在建立语音识别系统的过程中错误率评估起着非常重要的作用!传统的词错误率算法仅仅是基于最小错误率,具有显著的缺陷!因而不能准确评估系统的错误率#提出一种改进的基于最小错误率和时间信息的词错误率评估算法!能够准确评估系统的错误率!为声学模型的优化提供指导!同
2、时列举了该评估算法在建立语音识别系统过程中的应用#关键词"模式识别$词错误率$时间信息$语音识别中图分类号"TP391.42文献标识码"A文章编号"1007-2276!2005"01-0106-!"ImprovedWordErrorRateevaluationalgorithmforautomaticspeechrecognitionWUBian,LANShi!yong,LIUChong!ging!InstituteofImageProcessing&PatternRecognition,ShanghaiJiaotongUniversity,Shanghai200030
3、,China"Abstract"TheerrorrateevaluationisveryimportantinbuildinganAutomaticSpeechRecognition(ASR)system.TheconventionalalgorithmforWordErrorRate(WER)evaluationisbasedontheminimumerrorrate.TheimprovedWERalgorithmisproposedonthebasisofminimumerrorratetimeinformation,whichmakestheWERevaluati
4、onontheoverallsystemmoreaccurate.Thentheacousticmodelthencanbeimprovedaccordingtotheevaluation.TheapplicationsofthenewalgorithminbuildingapracticalASRsystemisalsopresented.Keywords"Patternrecognition$WordErrorRate$Timeinformation$Automaticspeechrecognition!引言地解决问题a改进系统的性能O错误率分析在语音识别系统的研究
5、和开发中起着重要的作用O在建立一在建立语音识别系统的过程中a评价语音识别系个与说话人无关命令识别系统的过程中a需要一个统的性能是非常重要的O通常a通过错误分析a剔除人工神经网络用于拒识所有不G清晰$的命令a而神对声学模型训练有害的数据a优化声学模型的训练经网络的训练要用到所有识别正确的词a要求能为以达到改进整个系统性能的目的O另一方面a可以通识别结果中每个词的识别正确性进行准确的标注a过测试系统的词错误率a分析错误的原因a有针对性产生这些标注是错误率评估的另一作用O收稿日期22004-03-103修订日期22004-05-10作者简介2吴边(1977-)a男a江西南昌人
6、a博士生a从事模式识别语音识别多媒体技术方面的研究a在SCI检索期刊上发表论文2篇O第1期吴边等!一种改进的语音识别词错误率评估算法107可见传统的算法是基于错误率最小准则的,而没1问题的提出有深入细致的分析O由这种评价算法得到的词错误率,只能粗略地反映语音识别系统的错误率,对进一目前词错误率被广泛用于评价语音识别系统性步改进整个系统性能的作用有限,有时甚至会给出能,词错误率能够直接反映识别系统声学模型的性错误的结果O语音信号不仅仅是字符串,更重要的是能,也是其他评估指标如串错误率(句错误率>的基[1]一个时间序列,传统的错误率评估算法忽略了语音础O传统的词错误率评
7、估算法在语音识别中存在三种典型的词错误:识别结果的时间信息,因为同样的一个识别句子与(1)替换错误(Substitution)参考句子相比时,考虑时间信息和忽略时间信息会在识别结果中,正确的词被错误的词代替;得到完全不同的评估结果O(2)删除错误(deletion)表1中start和end分别指起始帧数和结束帧数,在识别结果中,丢失了正确的词;一般情况下帧长为10ms,前三列显示的是人工标记(3)插入错误(Insertion)的结果,后三列是通过语音识别系统输出的结果,识在识别结果中,增加了一个多余的词O别出来的结果按照传统的方法评估(R