语音质量评估

语音质量评估

ID:38062188

大小:47.01 KB

页数:6页

时间:2019-05-24

语音质量评估_第1页
语音质量评估_第2页
语音质量评估_第3页
语音质量评估_第4页
语音质量评估_第5页
资源描述:

《语音质量评估》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、通常,人既是语音的发送主体,也是语音的接收主体。语音所具备的自然属性和社会属性决定了人对语音的感知涉及到语音信号的物理特征、听觉器官对语音的听觉表征及听觉心理等诸多方面,因此难以对语音质量这个概念做出全面、精确的定义。一般说来,语音质量至少包括三个方面内容:清晰度、可懂度和自然度。清晰度是指语音中语言单元为意义不连贯的(如音素、声母、韵母等)单元的清晰程度;可懂度是指语音中有意义的语言单元(如单词、单句等)内容的可识别程度;自然度则与语音的保真性密切相关。目前对语音可懂度、清晰度的主观评测己有国际和国内标准,对语音自然度还缺乏公认的评价准则。语音质量受到个人区别、可理解性、语音特征

2、、周围环境、背景噪声传输、网络状况和人的期望等复杂的因素影响.用于评价输出语音质量的方法分为主观评价和客观评价两种1主观评价法主观评价方法以人为主体在某种预设原则的基础上对语音的质量作出主观的等级意见或者作出某种比较结果,它反映听评者对语音质量好坏的主观印象。不同的主观评价方法对语音质量考察的侧重点不同,常见的主观评价方法有平均意见分(MeanOpinionScore,MOS)方法、判断韵字测试(DiagnosticRhymeTest,DRT)方法、失真平均意见分(DegradationMeanOpinionScore,DMOS)、判断满意度测试(DignosticAcceptab

3、ilityMeasure,DAM)方法和汉语清晰度测试。ITU-T推荐用于传输性能的主观评价有以下几种[14]:1.绝对等级评价(AbsoluteCategoryRating,ACR)ACR主要通过平均意见分(MOS)对音质进行主观评价。这种情况下没有参考语音,听音人只听失真语音,然后对该语音作出1-5分的评价。ACR评价方法不需要参考音,比较灵活,然而由于人对不同声音的喜好不同,这种灵活性会导致一定的不公平性。2.失真等级评价(DegradationCategoryRating,DCR)DCR主要通过失真平均意见分(DMOS)来实现音质的主观评价。这种评价方法要求听音人在给失真语

4、音打分前,先熟悉原始语音(参考语音),再将失真语音与原始语音的差异按一定标准来描述。DCR常用于评价诸如汽车噪声、街道噪声或其他说话人干扰等为背景噪声情况下的音质。噪声的类型和数量将直接影响评定的失真等级。3.相对等级评价(ComparisonCategoryRating,CCR)CCR方法主要采用相对平均意见分(CMOS)对音质进行主观评价。CCR类似于DCR,不同的是,在CCR方法中,原始语音和失真语音的播放次序是随机的,听音人不知道哪是原始音、哪是失真音。听音人只是在上一个音的基础上,评定出当前音相对于上一音的好坏。CCR方法允许对处理后语音(失真语音)的评价高于原始音的评价

5、,因此,它可以用来评价具有噪声抑制和语音增强功能的编码器,也可以用来比较两种未知编码器的性能优劣。MOS得分方法是由CCITT推荐的主观评价方法,现已广泛作为不同系统之间的比较标准。它采用五级评分制MOS判分语音质量失真觉察程度收听注意力等级5优(excellent)不察觉可完全放松,不需要注意力4良(Good)刚有察觉需要注意,但不需明显集中3一般(Fair)有察觉且刚觉可恶中等程度的注意力2差(Poor)明显察觉且可厌但可忍受需要集中注意力1劣(Unacceptable)不可忍受即使努力去听,也很难听懂MOS评分中质量优表示重建语音和原始语音只有很少的细节差异,且若不进行对照听

6、比就觉察不出这种差异质量良表示重建语音的畸变或失真不明显,不注意听感觉不到;质量一般表示重建语音有比较明显可感知的畸变成失真,但语音自然度和清晰度仍很好,且听起来没有疲劳感;质量差表示重建语音有较强的畸变或失真,听起来已有疲劳感;质量极差表示重建语音的质量极差,听觉无法忍受。在数字语音通信中,通常认为MOS分为4.0 4.5为高质量数字化语音,达到长途电话网的质量要求,接近于透明信道编码,也常称之为网络质量。MOS分为3.5分左右称为通信质量,这时能感到重建话音质量有所下降,但不妨碍正常通话,可以满足多数语音通信系统使用要求。MOS分3.0以下常称为合成语音质量,指一些声码器合成的

7、语音所能达到的质量。它虽然有较高的可懂度,但自然度较差MOS得分法的优点是: 由于编码系统的质量是按数值大小等级排列,所以不同失真类型的编码系统就可以相互比较; 评测者只需实现进行简单训练,就可直接参与评测,因而容易完成.其缺点是:它把不同种类的失真混为一谈,没有指出失真的原因,不利于算法的改进。另外,测试条件的选择及其他一些因素会影响MOS方法的结果判断韵字测试(DRT)判断韵字测试是反映语音清晰度或可懂度的一种测试方法,它主要用于低速率语音编码的质量测试,因为这时

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。