基于统计模型的说话人识别研究与实现

基于统计模型的说话人识别研究与实现

ID:32974955

大小:3.36 MB

页数:86页

时间:2019-02-18

基于统计模型的说话人识别研究与实现_第1页
基于统计模型的说话人识别研究与实现_第2页
基于统计模型的说话人识别研究与实现_第3页
基于统计模型的说话人识别研究与实现_第4页
基于统计模型的说话人识别研究与实现_第5页
资源描述:

《基于统计模型的说话人识别研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1分类号UDC渤密级l8l3957学位论文基于统计模型的说话人识别研究与实现(题名和副题名)李丽娟(作者姓名)指导教师姓刍吐蕉耋丝蝗昱电子科技大学成都(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业名称计算机软件与理论论文提交日期2010.04论文答辩日期2010.05一学位授予单位和日期电子科技大学答辩委员会主席评阅人年月日注1:注明《国际十进分类法UDC))的类号。,J_蜃,。、-独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研

2、究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:奎函幽日期:为b年f月可日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复E;p件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:一蛐导师签名:蜱日期:加扣年f月2/日1—I’二。JP

3、▲弭一●‘z,■【▲I摘要说话人识别属于语音信号处理中的一种,它主要是通过挖掘语音信号中反映说话人生理和行为等个性特征的语音参数来识别说话人的身份。说话人识别中的关键技术问题就是特征参数的提取和模型的建立。本文主要从以上两个方面来进行与文本无关的说话人识别研究。随着多媒体数据的爆炸式增长,使得对音乐数据库中的数据进行有效的管理显得越来越重要。近年来利用语音信号处理技术并结合音乐数据本身的特点来分析和处理音乐数据的研究已成为一个非常有价值的热门课题。本文将说话人识别中的相关技术应用到音乐信号处理中。通过广泛地研究近年来说话人识别中常用的特征参数和建模方法,本文在处

4、理语音数据时,主要提取基于Mel频率的倒谱系数(MFCC)作为语音的特征参数,高斯混合模型(GMM)作为语音描述的模型。并在MFCC特征参数的基础上提出能提高系统性能的CMFCC特征参数:将MFCC参数进行去均值处理后得到的特征参数。在研究说话人识别的基础上,提出能有效分离音乐数据中歌唱部分声音(pvoc)和伴奏部分声音(svoe)的线性组合模型(LGMM):首先对手工标注的pvoe和SVOC数据建立一个GMM模型,然后用纯歌唱部分数据和纯伴奏部分数据分别建立相应的另一个GMM模型,最后将各类数据的GMM模型进行线性组合得最终的概率模型。本文主要工作如下:1、在

5、无噪声环境下,分别用MFCC、CMFCC特征参数、GMM模型以及广义高斯混合模型(UBM.GMM)建立与文本无关的说话人识别系统。2、将MFCC特征参数和GMM模型应用到音乐中歌唱部分数据(pvoc)和伴奏部分数据(svoc)的分离中,给出LGMM模型建立的具体方法和过程,并将其应用到音乐中pvoc和SV00数据分离的实验中。3、根据LGMM方法,首先分离出音乐中的歌唱部分数据(pvoc)和伴奏部分数据(svoe),利用pvoc数据和SVOc数据建立基于IVIFCC特征参数和GMM模型的歌唱家识别系统。4、通过实验分析训练数据长度、GMM模型中高斯分量个数对系统

6、性能的影响,并比较了MFCC和CMFCC参数以及GMM,UBM—GMM,LGMM模型建立摘要的系统性能。实验结果证实了CMFCC特征参数和UBM.GMM,LGMM模型能有效提高系统识别率。本文通过大量的实验表明,MFCC参数和GMM模型能有效地用于说话人识别,音乐信号处理中,实验结果还证实了本文提出的CMFCC特征参数和LGMM模型能有效地提高系统性能。关键词:说话人识别,歌唱家识别,歌唱部分和伴奏部分数据分离,高斯混合模型,梅尔频率倒谱系数ⅡPIi~’J一’-‘。ABSTRA(了rABSTRACTSpeakerrecognitionbelongstoakind

7、ofspeechsignalprocessing,itidentifiesspeakerbyminingthepersonalizedfeaturesinspeechsignalwhichrepresentspeaker’Sphysiologicalandphysicalcharaetors.ThekeytechnologiesofSpeakerRecognitionarefeatureextractingandspeakermodelbuilding.Thisthesisstudiesthetext-independentspeakerrecognition舶

8、mthesesabove

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。