基于模糊综合评价法的情感语音数据库的建立

基于模糊综合评价法的情感语音数据库的建立

ID:31360090

大小:117.00 KB

页数:11页

时间:2019-01-09

基于模糊综合评价法的情感语音数据库的建立_第1页
基于模糊综合评价法的情感语音数据库的建立_第2页
基于模糊综合评价法的情感语音数据库的建立_第3页
基于模糊综合评价法的情感语音数据库的建立_第4页
基于模糊综合评价法的情感语音数据库的建立_第5页
资源描述:

《基于模糊综合评价法的情感语音数据库的建立》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于模糊综合评价法的情感语音数据库的建立  摘要:为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。  关键词:情感语音数据库;模糊综合评价;层次分析法;熵权法;情感语音识别  中图分类号:TN912?34文献标识码:A文章编号:1004?373X

2、(2016)13?0051?04  Abstract:Toestablishareal,naturalandabundantemotionalspeechdatabase,fouremotiontypesofhappy,surprise,sadandangryarechosen.Thewayofradiodramainterceptingisusedtoobtaintheemotionalspeechdatabaseinprimarystage.Thefuzzycomprehensiveevaluationmodelofemotionalspeechwasestablishedinc

3、ombinationwithfuzzycomprehensiveevaluation,analytichierarchyprocessandentropyweightmethod.Thefuzzyevaluationforthedatabaseinprimarystagewasconductedwiththemodelto11obtainthefinalemotionalspeechdatabasewithhighquality.Threekindsofspeechdatabaseswereappliedtotheemotionalspeechrecognitionexperimen

4、t.Thedifferencesofdifferentdatabasesarecomparedandanalyzed.Theeffectivenessofthisdatabasewasverified.  Keywords:emotionalspeechdatabase;fuzzycomprehensiveevaluation;analytichierarchyprocess;entropymethod;emotionalspeechrecognition  语言是人类交换信息最方便、最快捷的一种方式。在高速发达的信息社会中,情感语音技术的发展为实现人与机器的情感交流提供可能[1]。

5、情感语音数据库是情感语音识别的基础,语音库的质量决定着情感语音识别系统性能的优劣。高质量的情感语音数据库有利于情感语音特征的分析提取,有利于情感语音识别系统判断说话人的情感状态,因此如何构建一个真实、自然、可靠的情感语音数据库就显得尤为重要。而语音数据库质量高低要从情感准确度、噪声影响、自然度等角度综合评判。本文利用模糊综合评价结合层次分析法(AnalyticHierarchyProcess,AHP)、熵权法构建模糊综合评价模型,将定性分析转化为定量分析,为数据库的有效性提供了保障。最后,本文将表演型数据库、激励型数据库和摘引型数据库应用于情感识别研究中,对比分析不同类型的数据库之间

6、的差异,同时也验证了本数据库的有效性。  1初选阶段情感语音数据库的建立11  目前,在国内外语音研究领域,由于研究需求、获取途径、情感分类、语种等差异,情感语音数据库种类繁多(如Maribor数据库、CASIA数据库、VAM[2])。按照获取方式的不同,情感语音数据库大致可分为四类[3]:表演型、激励型、启发型和摘引型。摘引型情感语音数据库有着较高的情感真实度,情感表达直接由心理状态触发而成,并且在多媒体素材中有上下文内容,为以后的研究提供关联信息。因此选择构建摘引型情感语音数据库。为了截取并建立高质量的情感语音库,多媒体素材需要在语种、语义、规模、情感、信噪比方面符合一定的要求[

7、4]。广播剧是一种戏剧形式,通过声音进行传播,能给听众创造无限的想象空间[5]。广播剧中语料来源于专业演员,所用语言为标准普通话,贴近生活,符合日常表达习惯,有着丰富的情感成分,并且对人物语言精确性、表现力要求高,语音质量好。基于以上特点,考虑到情感丰富性、人物多样性、情节多变性等因素,选取广播剧作为截取语音库的媒体素材。  参考Rusell等人运用情感理论构建情绪二维模型[6],本文选择高兴、惊奇、悲伤和愤怒四种情感粒度大、混淆度低的情感类别构建数据库。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。