欢迎来到天天文库
浏览记录
ID:5269784
大小:266.61 KB
页数:8页
时间:2017-12-07
《汉语数码语音识别:发展现状,难点分析与方法比较》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、维普资讯http://www.cqvip.com第2卷第4期电路与系统学报Vol2No43219971I71JOURNALoFCIRCUITSANDSYSTEMSNovember】997更语№语音识别:发展现状、难点分析与方法比较—1数-h.nDigitSpeechRecognition:StateoftheArt,DifficultPoints/,、Analys。sandMethodsComparisonf//习大⋯),【摘要】车文简述了汉语码语音识别的发展与现状,分析了汉语数码语音识别的混淆度现象厦其它困难,比较了各糕Abstractt::捌Revwl~鬻ingtheStateo’8the
2、tortofManda龇rindigi’tspeechrecognitio强n.thispban幅手thehighconfusionandotherdif-更在95%以下,由此可见,目前的汉语数码语音识1引言别水平尚远远落后于英语数码语音识别水平。语音识别技术近些年来有了突飞猛进的发本文将首次分析汉语数码语音识别的困难所展。在众多的语音识别任务中,最先进入实用化在,然后综述比较各种语音识别方法在数码语音的是英语数码语音识别⋯,而以AT&T公司I、识别中的效果,并提出了若干改进途径。美国卡内基一梅隆大学、英国剑桥大学⋯等为2汉语数码语音识别的困难代表的研究机构目前则正致力于开发具有英语非特定人、
3、大词汇量、连续语音识别功能的实用产品,而且已经取得了相当喜人的成果。同时,剑表1中英文数码语音及音节数分布桥大学和菲浦公司还正在研究英语语音识别算法{平均音节数!英语一29汉语一21在其它欧洲语种中应用的可能性及效果I。在汉数码英语发音音节数汉语发音音节数语语音识别方面,国内外的汉语大词汇量语音识0Zero4[1ing]3别都达到了相当高的水平。与此相反,汉语1Olie3[yi]l数码语音识别(即⋯0’~⋯9’汉语语音识别)技2Two2[el,]l术虽然在移动通信、电脑话务员、电话证券交易3qllree3san]3等领域有着极大的应用价值,并因此受到了国内4Four2[si]2科研单位广泛重视
4、⋯⋯.但是其进展却相当缓慢5Five3[wu]1⋯】。英语数码语音识别的非特定人单字和数码串识6Six3[1]3别率早已分别达到了99.7%和9911%以上,而7Seven4[qi]2至今文献可查的汉语数码语音识别非特定人单字8Eight2[h]2识别率尚无一超过99%,连续数码串的识别率则9Nine3[j]3·收文日期:1997年5月2613(May26,1997)c.-GuLiang.Runsheng(QinghuaUnversity、Beijing、100084)维普资讯http://www.cqvip.com顾良等:议语数码语音识别:发展现状、难点分析与方法比较33从字表容量太小来看,
5、汉语数码音识别应该表2中英文数码语音混淆情况比较是最简单的一种汉语语音识别任务,因为它包含(音节包窖是指语音中一个语音包古了另一十1O或11个(若数码⋯1’有[vi】和[yao】两种发音)语音的全部音节)字。然而事实并非如此。这主要中因为汉语数码语种英语汉语音识别有以下两方面的困难:0—1,0—3,O_4,0-6,0-7,21语音闻的高混淆单语0-3,0—6,1—7,1-9.2—8,0—9,1_4.1—6.1-7,1—9,显然.音节越少,语音之间的相似积程度越音音节对3—6,4-5,5—7.6—7,7—93l4,3-8.4—6,.4—9,太.识别的困难程度也就越太。表1列出了中英相6—7,6—
6、9.7—9同总文数码音的发音及音节个数分布。表2列出了中数1O18英文数码语音的不同混靖情况。从中可以看出.双语英文数码语音的平均音节数比汉语数码语音多音音无0—6.6—9节对38%,单音节相同的语音对明显偏低,且根本没相总02有双音节相同或音节包容的情况。这此都说明.同数音语汉语数码语音的混淆远远大于英语数码语音。无1—4.1—6.1—7.1—9语音混淆对语音识别效果的影响早已引起了节对包容总04研究工作者们的注意。1975年,日本学者Itaku.数1"a”用DTW方法进行200个日本城市名的特定人语音识别,获得了983%的识别率,而当用同样方法应用于日文字母语音识别时,却只得到了无线通信中
7、的无线手机语音拨号。由于环境复88%的识别率。l994年,Rabin,erll在一项比较中杂、噪声源较多(如汽车发动噪声、街道人群噪音指出只含三十九个字的英语字母音识别任务(包含等),使得相应的数码语音识别任务相当艰巨。二十六个字母、⋯0~⋯9十个数码及三个控连续语音问题:汉语数码连续语音的连续程制字)的误识率甚至高于一个由1800个字构成的度要高于英语数码发音,这是由于纯元音语音(即英语航空旅行
此文档下载收益归作者所有