基于长时特征的鲁棒声学事件检测

基于长时特征的鲁棒声学事件检测

ID:32527318

大小:6.43 MB

页数:126页

时间:2019-02-11

基于长时特征的鲁棒声学事件检测_第1页
基于长时特征的鲁棒声学事件检测_第2页
基于长时特征的鲁棒声学事件检测_第3页
基于长时特征的鲁棒声学事件检测_第4页
基于长时特征的鲁棒声学事件检测_第5页
资源描述:

《基于长时特征的鲁棒声学事件检测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP39学校代码:10213国际图书分类号:681.3密级:公开工工工学学学博博博士士士学学学位位位论论论文文文基于长时特征的鲁棒声学事件检测博士研究生:石自强导师:韩纪庆申请学位:工学博士学科:人工智能与信息处理所在单位:计算机科学与技术学院答辩日期:2013年1月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP39U.D.C:681.3DissertationfortheDoctoralDegreeinEngineeringROBUSTACOUSTICEVENTDETECTIONBASEDONLONG-TERMFE

2、ATURESCandidate:ShiZiqiangSupervisor:Prof.HanJiqingAcademicDegreeAppliedfor:DoctorofEngineeringSpecialty:ArtificialIntelligenceandInformationProcessingAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:January,2013Degree-Conferring-Institution:HarbinInstituteofTechnolo

3、gy摘要摘要声学事件是指一段单一完整并能引起人们感知注意的连续声音信号,而对这样的信号进行检测即是声学事件检测。随着便携式摄像机与视频网站的迅猛发展,声学事件检测在各领域的应用日趋广泛,例如个性化多媒体搜索、数字图书馆、网络管理与信息安全等。近年来,尽管研究者们提出了很多声学事件检测方法,但由于采集设备、采集环境与传输条件等的千差万别,新环境下的音频数据日趋繁杂,使得类内数据差异较大而类间数据更加易混,从而导致传统识别方法的性能急剧下降,因此迫切需要研究当前环境下的鲁棒声学事件检测方法。本文针对上述问题,从特征和模型等不同层面逐一展开研究,提出了一

4、系列解决方法,主要的研究内容包括:1.提出了基于基频段长时统计特征的声学事件检测方法。考虑到多数声学事件长度不等,但大多由发音帧组成,因此尝试取代以往识别中常用的固定时长单元,而采用不定时长的基频段作为识别的最小单位。在此基础上,提出了包括基频的均值、方差、直方图、时序及韵律等统计特征。实验表明,与传统定长特征相比,基频段特征能够有效的提高声学事件检测的准确率与召回率。2.提出了基于伪高斯混合模型与异质混合模型的声学事件检测方法。传统的高斯混合模型是在原始空间中使用单一的分布来对数据进行密度估计,其不适合繁杂的数据环境。为此,本文将传统的混合模型加

5、以推广,提出了伪高斯混合模型与异质混合模型。前者通过在特征之间引入非线性度量,在高维空间中对数据建立高斯混合模型,从而使低维空间中不可分的复杂数据在高维映射空间中能够分开;后者通过引入不同的分布,建立异质的混合模型,使分布之间优势互补,从而能够选择最适合的分布对不同数据进行建模。实验结果表明,所提出的推广混合模型更适合复杂数据,识别效果优于传统的高斯混合模型。3.提出了基于稀疏与低秩特征的声学事件检测方法。传统的事件检测方法中,特征受外界噪声的影响较大,在繁杂数据情况下性能会明显下降。本文基于稀疏编码理论提出了基于稀疏分解的鲁棒音频特征,它较好的模

6、拟了人耳的听觉特性,对噪声有良好的鲁棒性。进一步,考虑到长时特征对判决有较大的帮助,亦将短时的稀疏特征推广到长时的多维表示,提出了具有低-I-哈尔滨工业大学工学博士学位论文秩性质的矩阵及张量音频特征。由于低秩特征对环境具有一定的不敏感性,能够表示声学事件在不同噪声环境,特别是随机大幅噪声下的不变性,因此具有较好的鲁棒性。实验结果表明,所提出的特征均取得了比传统音频特征较优的识别性能。4.针对传统支持向量机方法不能充分利用矩阵与张量数据中结构信息的问题,通过推广传统的基于最大边际分类准则的分类方法,提出了基于松弛边际模型的声学事件检测方法。它通过将支

7、持向量机的最大边际分类原则与迹范限制相结合,直接在原始空间中对低秩音频特征进行分类,有效的利用矩阵与张量特征中的结构信息。并且它能够在最大化边界的同时,最小化分类器在低秩及欧式度量下的复杂程度。与目前最优的矩阵和张量分类方法相比,所提出的算法在声学事件检测任务上取得了较优的性能。5.提出了基于并行训练的声学事件检测方法。由于当前的音频数据量大,且大多为流媒体形式,传统的基于一次性加载数据的批处理训练方法不再适用。为此,本文提出了基于低秩特征的在线训练方法,同时亦提出了相应的若干加速算法。该算法随着运算单元的增加,理论上运算速度会呈现线性增加。实验结

8、果表明,所提出的方法能使算法的速度提高10倍左右。关键词:声学事件检测;混合模型;稀疏特征;低秩特征;在线学习;松弛边际-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。