基于数字指纹的音频检索系统的设计与实现

基于数字指纹的音频检索系统的设计与实现

ID:33286842

大小:2.29 MB

页数:77页

时间:2019-02-23

基于数字指纹的音频检索系统的设计与实现_第1页
基于数字指纹的音频检索系统的设计与实现_第2页
基于数字指纹的音频检索系统的设计与实现_第3页
基于数字指纹的音频检索系统的设计与实现_第4页
基于数字指纹的音频检索系统的设计与实现_第5页
资源描述:

《基于数字指纹的音频检索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA专业学位硕士学位论文MASTERTHESISFORPROFESSIONALDEGREE(电子科技大学图标)论文题目基于数字指纹的音频检索系统的设计与实现专业学位类别工程硕士学号201122250427作者姓名高昕晟指导教师李辉教授分类号密级注1UDC学位论文基于数字指纹的音频检索系统的设计与实现(题名和副题名)高昕晟(作者姓名)指导教师李辉教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称电子与通信工程提交论文日期2014-4-

2、29论文答辩日期2014-5-27学位授予单位和日期电子科技大学2014年6月日答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。DIGITALFINGERPRINT-BASEDAUDIORETRIEVALSYSTEMDESIGNANDIMPLEMENTATIONAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:ElectronicsandCommunicationEngineeringAuthor:XinchengGaoAdvisor:ProfessorHu

3、iLiSchool:SchoolofAstronautics&Aeronautics独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人

4、授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日摘要摘要近年来,随着多媒体技术的普及,音频数据在网络上有了爆炸性的增长,这使得开发高效的检索分类音频数据的方法越来越受到关注。基于内容的音频检索系统利用从信号中提取出的声学特征与数据库中存储的声学特征进行比对从而检索出音频信号的元数据(作者,专辑,流派等)。其潜在应用包括自动音频识别,音频轨迹跟踪,版权保护,电视节目检索,广告背景音乐检测等等。本篇论文主要实现了基于内容的音频检索即通过数

5、字音频指纹来检索识别音频文件。数字音频指纹是从音频内容中提取出的一段可以代表音频重要声学特征的紧致数字签名,将数字音频指纹作为用于识别音频的索引,并和相应的元数据信息内容一起存储在数据库中,检索时将未知音频文件提取出的数字音频指纹与数据库中存储的进行比对从而识别出未知音频文件。本文着重对影响着音频检索系统鲁棒性的几个重要步骤:特征提取,指纹模型和匹配进行了研究:首先,本文研究比较了几个频谱特征,包括梅尔频率倒谱系数(Mel-FrequencyCepstralCoefficients,MFCCs),色度频谱(ChromaSpectrum),常数Q值转换频谱(ConstantQSp

6、ectrum),以及积谱(ProductSpectrum)。前三个特征提取只是来源于幅度谱,其已经广泛应用于音频信号处理及关键点检测,而积谱则利用了幅度谱与群延迟的乘积,它在鲁棒语音识别中效率非常高。实验表明在音频检索系统中本文所用的基于积谱的特征提取方法比前三种特征提取方法更具有更高的检索精确度。其次,本文提出了一个累积相似模型,以便能更好地提取出音频数据之间的相似度。实验表明累积相似模型比欧氏距离模型具有更好的效率与精确度。第三,本文使用高斯混合模型来提高音频检索系统的鲁棒性。高斯混合模型通过使用期望最大值算法(EM)来训练音频数据库,高斯混合模型能更好地描述声学特征的特点

7、。通过训练高斯混合模型,数据库中的音频和待检测音频片段的特征向量都转换成了象征性的符号标记,然后在数据库中进行检索。实验结果表明了高斯混合模型的优点,它即使在严重的噪声失真的情况下依然保持着较高的精确度。最后,通过实验将本文提出的方法与一种目前通用的音频检索方法AudioDNA进行了比较。本文的方法与AudioDNA的最大区别是声学特征提取方法的不同与以及相似性度量方法的不同。实验结果表明,本文提出的方法更能抵抗噪声攻击引起的失真。I摘要关键词:数字音频指纹特征提取高斯混合模型累积相似模型频

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。