采用三音节fo 插值的连续语音声调评测算法

采用三音节fo 插值的连续语音声调评测算法

ID:15000266

大小:175.00 KB

页数:4页

时间:2018-07-31

采用三音节fo 插值的连续语音声调评测算法_第1页
采用三音节fo 插值的连续语音声调评测算法_第2页
采用三音节fo 插值的连续语音声调评测算法_第3页
采用三音节fo 插值的连续语音声调评测算法_第4页
资源描述:

《采用三音节fo 插值的连续语音声调评测算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、沈彩凤等:采用三音节F0插值的连续语音声调评测算法采用三音节F0插值的连续语音声调评测算法沈彩凤,俞一彪(苏州大学电子信息学院语音处理研究室,苏州215006)摘要:本文研究连续语音的声调评测算法,该算法可应用于计算机辅助语言学习(CALL)系统和普通话水平测试(PSC)中的声调评测。考虑到连续语音发音中前后音之间的相互影响,采用三音节单元建立GMM声调模型,三音节中辅音部分用Spline插值法拟合声调曲线来反映音节间基音频率的转移信息。实验表明,基于三音节声调曲线插值拟合的GMM模型评测方法可以使机器打分和人工打分的相关性从0.733提升到0.764。关键字:声调评测;连续语音;Spl

2、ine插值;基音曲线拟合;GMM中图分类号:TN912文献标识码:A文章编号:1000-3630(2011)-02-0111-06DOI编码:10.3969/j.issn1000-3630.2011.02.001ToneevaluationofMandarincontinuousspeechbasedonTri-syllableF0interpolationSHENCai-feng,YUYi-biao(SoochowUniversity,SpeechProcessingResearchesLaboratory,Suzhou,215006,China)Abstract:Thispaperd

3、iscussestoneevaluationalgorithmofMandarincontinuousspeechbasedonGMM.ThisalgorithmcanbeusedfortonepronunciationinComputerAssistedLanguageLearning(CALL)andPUTONGHUASHUIPINGCESHI(PSC).Incontinuousspeech,asyllable’stoneisrelatedtotheadjacentsyllables.Therefore,itisusefultousetri-syllableasbasicunitto

4、trainGMM.Togetthetransitioninformationfromthepreviousvoicedregiontothecurrentoneorfromthecurrenttothenextvoicedregion,thepitchvalueofunvoicedregionisinterpolatedwithSpline.Basedontri-syllableSplineinterpolation,thecorrelationofthemachinescoreandhumanscorerisesfrom0.733to0.764.Keyword:toneevaluati

5、on;continuousspeech;Splineinterpolation;GMM;沈彩凤等:采用三音节F0插值的连续语音声调评测算法0引言汉语作为一种声调语言,每个音节都有声调,不同声调的同音字语义不同。因此,声调是判定普通话学习好坏的重要因素之一,也是区别方言和普通话的不可或缺的标准。在计算机辅助语言学习(CALL)以及普通话水平测试(PSC)中,不仅强调对汉语音节的发音的正确性,也越来越多的关注普通话声调的错误与否。2007年,汤霖等人在分析普通话声调特点的基础上,提出了能消除语速影响和音节间相互影响的建模方法,选择反映声调特点的5个基频比值与归一化的基频共同作为声调评测参数建

6、立高斯模型,结果客观测试同主观测试负荷率达到88.24%[1]。2008年,魏思等人提出了基于韵律信息的连续语流—————————————————收稿日期:2011-06-06;修稿日期:2011-06-11基金项目:北京市现代信息科学与网络技术(XDXX1006)作者简介:沈彩凤(1986-),女,江苏省宿迁人,汉族,苏州大学电子信息学院硕士研究生,研究方向为语音信号处理。通讯作者:俞一彪,yuyb@suda.edu.cn。调型评测研究,以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型MSD-HMM,针对有河南与山东方言背景的非标准发音,机器评分与专家评分相关度达到0.6

7、61和0.695[2]。声调主要是有语音的基频轮廓决定的。普通话的标准声调有四个调型,按照五度值描述系统可表达为:阴平(55),阳平(35),上声(214),去声(51),但是,这种标准声调值只出现在孤立字发音情况下,在连续语音发音中,由于单字发音受上下文的影响,声调对应的基频曲线与标准情况会发生很大的偏离。考虑到连续语音发音中前后音节对当前音节声调的影响,本文以三音节为声调单元建立GMM模型,对测试语音利用后验概率给出声调的客观评

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。