采用三音节fo 插值的连续语音声调评测算法

ID：15000266

大小：175.00 KB

页数：4页

时间：2018-07-31

资源描述：

《采用三音节fo 插值的连续语音声调评测算法》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、沈彩凤等：采用三音节F0插值的连续语音声调评测算法采用三音节F0插值的连续语音声调评测算法沈彩凤，俞一彪（苏州大学电子信息学院语音处理研究室，苏州215006）摘要：本文研究连续语音的声调评测算法，该算法可应用于计算机辅助语言学习（CALL）系统和普通话水平测试(PSC)中的声调评测。考虑到连续语音发音中前后音之间的相互影响，采用三音节单元建立GMM声调模型，三音节中辅音部分用Spline插值法拟合声调曲线来反映音节间基音频率的转移信息。实验表明，基于三音节声调曲线插值拟合的GMM模型评测方法可以使机器打分和人工打分的相关性从0.733提升到0.764。关键字：声调评测；连续语音；Spl

2、ine插值；基音曲线拟合；GMM中图分类号：TN912文献标识码：A文章编号：1000-3630(2011)-02-0111-06DOI编码：10.3969/j.issn1000-3630.2011.02.001ToneevaluationofMandarincontinuousspeechbasedonTri-syllableF0interpolationSHENCai-feng,YUYi-biao(SoochowUniversity,SpeechProcessingResearchesLaboratory,Suzhou,215006,China)Abstract:Thispaperd

3、iscussestoneevaluationalgorithmofMandarincontinuousspeechbasedonGMM.ThisalgorithmcanbeusedfortonepronunciationinComputerAssistedLanguageLearning(CALL)andPUTONGHUASHUIPINGCESHI(PSC).Incontinuousspeech,asyllable’stoneisrelatedtotheadjacentsyllables.Therefore,itisusefultousetri-syllableasbasicunitto

4、trainGMM.Togetthetransitioninformationfromthepreviousvoicedregiontothecurrentoneorfromthecurrenttothenextvoicedregion,thepitchvalueofunvoicedregionisinterpolatedwithSpline.Basedontri-syllableSplineinterpolation,thecorrelationofthemachinescoreandhumanscorerisesfrom0.733to0.764.Keyword:toneevaluati

5、on;continuousspeech;Splineinterpolation;GMM;沈彩凤等：采用三音节F0插值的连续语音声调评测算法0引言汉语作为一种声调语言，每个音节都有声调，不同声调的同音字语义不同。因此，声调是判定普通话学习好坏的重要因素之一，也是区别方言和普通话的不可或缺的标准。在计算机辅助语言学习（CALL）以及普通话水平测试（PSC）中，不仅强调对汉语音节的发音的正确性，也越来越多的关注普通话声调的错误与否。2007年，汤霖等人在分析普通话声调特点的基础上，提出了能消除语速影响和音节间相互影响的建模方法，选择反映声调特点的5个基频比值与归一化的基频共同作为声调评测参数建

6、立高斯模型，结果客观测试同主观测试负荷率达到88.24%[1]。2008年，魏思等人提出了基于韵律信息的连续语流—————————————————收稿日期：2011-06-06;修稿日期：2011-06-11基金项目：北京市现代信息科学与网络技术（XDXX1006）作者简介：沈彩凤（1986-），女，江苏省宿迁人，汉族，苏州大学电子信息学院硕士研究生，研究方向为语音信号处理。通讯作者：俞一彪，yuyb@suda.edu.cn。调型评测研究，以韵律词为基本建模单元，建立基于多空间概率分布的HMM调型模型MSD-HMM，针对有河南与山东方言背景的非标准发音，机器评分与专家评分相关度达到0.6

7、61和0.695[2]。声调主要是有语音的基频轮廓决定的。普通话的标准声调有四个调型，按照五度值描述系统可表达为：阴平（55），阳平（35），上声（214），去声（51），但是，这种标准声调值只出现在孤立字发音情况下，在连续语音发音中，由于单字发音受上下文的影响，声调对应的基频曲线与标准情况会发生很大的偏离。考虑到连续语音发音中前后音节对当前音节声调的影响，本文以三音节为声调单元建立GMM模型，对测试语音利用后验概率给出声调的客观评

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

采用三音节fo 插值的连续语音声调评测算法

采用三音节fo 插值的连续语音声调评测算法

相关文章

相关标签