语言清晰度的客观评测

语言清晰度的客观评测

ID:36913357

大小:2.49 MB

页数:29页

时间:2019-05-10

语言清晰度的客观评测_第1页
语言清晰度的客观评测_第2页
语言清晰度的客观评测_第3页
语言清晰度的客观评测_第4页
语言清晰度的客观评测_第5页
资源描述:

《语言清晰度的客观评测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音清晰度的客观评测中国传媒大学传播声学研究所章斯宇2010.5.21主要内容1语音清晰度评测的发展概况2混响作用下STIPA与清晰度的关系3噪声环境下STIPA与清晰度的关系4总结与展望1.语音清晰度的评测语音的清晰度或可懂度是音质评价的重要指标—反映厅堂或扩声系统的声音传输质量主观评价:组织测试队伍实地测试(articulationtest)优点:直接、真实缺点:耗费人力物力GB-T15508-1995《声学语言清晰度测试方法》《语音清晰度的客观评价方法STI%ALconAI主观测试尽可能反映真实

2、的清晰度水平清晰度指数AI(ArticulationIndex)French&Steinberg(1947),Fletcher(1953),Kryter(1962)1)测量或估计语言频谱和听音人处的噪声有效掩蔽谱计算得到各频带的“有效信噪比”;2)对各频带信噪比进行线性转化至[0,1]得“贡献值”;3)基于不同频带对清晰度的贡献率加权平均得AI;ANSIStd.S3.5-196919861997特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声或削峰等

3、时域或非线性失真的影响。辅音损失率%ALcon(articulationlossofconsonants)能不能根据测量房间内的某些物理量估计语音清晰度?Knudsen(1932),Peutz(1971),Klein(1971)根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。Peutz公式(经验推导)D—听音处距声源的距离。单位m。T60—混响时间(1400Hz)。单位s。V—房间的体积。单位m3。ɑ—校准值。针对不同水平的听者。1.5%~12.5%。Dc

4、—临界距离。单位m。注意:SNR>25dB;单个无指向性的点声源(Q=1);Klein对Peutz公式的补充当房间声学特性难以改善时,采用电声手段提高语音清晰度。声源个数n;声源指向性因子Q;虽然提高扬声器的Q值有助于改善语音清晰度,但Q值与清晰度之间是否成简单的线性关系并没有实际的实验数据支持。Jacob(1985)认为语音清晰度与Q并无直接的关联。辅音损失率%ALcon的不足根据实验结果的经验推导,物理基础不够;对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响;没有考虑

5、早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;Jacob(1985)Hougast&Steeneken(197319801985)IECStd.60268-16充分反映声传递系统性能质量的优劣输入端:说话人发音语言传输指数STI(speechtransmissionindex)输出端:听者耳朵语言传输系统:充分考虑传递过程中噪声、混响、回响、系统失真等各种干扰因素的影响BlackBox调制转移函数MTF(modulationtransferfunctio

6、n)连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。MTF的计算函数定义为声信号经传输后接收信号强度包络的调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。STI的计算14种调制频率;7种倍频带噪声作为测试信号计算98个MTF结果类似AI计算中的加权平均最终得STI[0,1]根据房间脉冲响

7、应可以直接计算MTFSTI与语音清晰度Steeneken(1980)不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。语言传输指数STI的简化算法限制条件:无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统;1)RASTI(RapidSTIorRoomacousticSTI)适用于不包括扩声系统的厅堂语音传输质量的评价选取了语言谱中比较有代表性的频带和调制频率500Hz1Hz

8、2Hz4Hz8Hz2KHz0.7Hz1.4Hz2.8Hz5.6Hz11.2Hz2)STIPA(STIforpublicaddress)适用于包括扩声系统的厅堂或电声系统的语音传输质量评价选取了7种倍频带载波,每种载波对应2中调制频率125Hz250Hz500Hz1KHz2KHz4KHz8KHz1.0Hz1.0Hz0.63Hz2.0Hz1.25Hz0.8Hz2.5Hz5.0Hz5.0Hz3.15Hz1.0Hz6.25Hz4.0Hz12.5Hz《公共广播系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。