基于LSTM网络的声学场景在线检测系统

基于LSTM网络的声学场景在线检测系统

ID:34954708

大小:1.96 MB

页数:62页

时间:2019-03-15

基于LSTM网络的声学场景在线检测系统_第1页
基于LSTM网络的声学场景在线检测系统_第2页
基于LSTM网络的声学场景在线检测系统_第3页
基于LSTM网络的声学场景在线检测系统_第4页
基于LSTM网络的声学场景在线检测系统_第5页
资源描述:

《基于LSTM网络的声学场景在线检测系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于LSTM网络的声学场景在线检测系统ACOUSTICSCENEONLINEDETECTIONSYSTEMBASEDONLSTMNETWORK汪瑞哈尔滨工业大学2018年6月国内图书分类号:TP391.4学校代码:10213国际图书分类号:681.3密级:公开工学硕士学位论文基于LSTM网络的声学场景在线检测系统硕士研究生:汪瑞导师:韩纪庆教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.4U.D.C:681.3DissertationfortheMas

2、terDegreeinEngineeringACOUSTICSCENEONLINEDETECTIONSYSTEMBASEDONLSTMNETWORKCandidate:WangRuiSupervisor:Prof.HanJiqingAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScience&TechnologyAffiliation:SchoolofComputerScience&TechnologyDateofDefence:June,2018Degree-Conferring-Institution

3、:HarbinInstituteofTechnology摘要摘要随着互联网的发展,多媒体技术的提升以及移动设备的大量普及,出现了大量的以线上直播为主要业务的网络平台。以短视频分享为主要业务的应用也日渐流行,目标用户也越来越广泛。平台和应用上承载的数据量之大、种类之庞杂,给用户搜索想要的数据资源带来了极大不便,同时也给网络数据的监管造成了麻烦。本文针对上述多媒体应用中的在线音频数据,搭建一套可以识别音频声学场景类别的在线检测系统。论文的主要内容有:(1)基于混合高斯模型(GaussianMixedModel,GMM)的声学场景识别方法。本文简要介绍了DCASE2016Task1声学场景

4、识别比赛,以及基于GMM的声学场景识别基线系统。该基线系统所使用的特征是梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)。对每个场景类型训练一个GMM模型。分类时,在各GMM模型的输出中选出最大值,其对应的类作为数据的预测类别。(2)基于长短时记忆网络(LongShortTermMemoryNetwork,LSTM)的声学场景识别方法。其主要目的是利用基于LSTM网络的声学场景识别模型,对具有鲜明声学场景特性的音频流进行区分。文中在介绍LSTM网络结构特点的基础上,阐述了与所研究模型相关的音频预处理、特征提取、分段处理、LSTM识别模型的训

5、练和测试等过程,最后给出了该识别模型的测试结果。该方法使用DCASE2016Task1声学场景识别比赛的数据集,最高达到了81.8%的准确率。(3)在线检测系统设计与实现。在线音频数据中的声学场景类别是开集,离线的训练数据无法包含在线数据中的所有类别。因此本文提出了一种能够动态区分在线数据中是否含有新类别数据的系统框架,并且能够及时地将新类别纳入到在线检测系统进行分析。为此设计了GMM区分模型以及基于LSTM的-I-摘要声学场景识别模型。最后,系统的测试结果表明基于LSTM的识别模型可以进行声学场景的在线分类,新的声学场景类别可以被系统接受并识别。关键词:声学场景识别;LSTM;GM

6、M;在线分析系统-II-AbstractAbstractWiththedevelopmentoftheInternet,thepromotionofmultimediatechnologyandthespreadofmobiledevices,therehavebeenalargenumberofonlineplatformswithlivebroadcastastheirmainbusiness.Theapplicationsthatkeepsharingvideosastheirmainbusinessarebecomingmorepopularandtheirtargetuse

7、rsarebecomingmoreextensive.Thelargeamountofmultimediadataandthevarietyofthem,carriedbytheplatformsandapplications,havebroughtgreatinconveniencetotheuserstosearchforthedesireddata,andalsocausetroubleforthesupervisionofthenetwork.Ai

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。