资源描述:
《特定类型音频流泛化识别方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、特定类型音频流泛化识别方法罗森林李金玉潘丽敏北京理工大学信息安全与对抗技术实验室,北京100081摘要:提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.
2、8%.音频检索;AdaBoost;Mel频率倒谱系数;特定音频流TP391A1001-0645(2011)10-1231-05AGenericMethodofRecognizingSpecificTypeAudioStreamLUOSen-linLIJin-yuPANLi-min2010-12-29国家“二四二”计划项目(2005C48);北京理工大学科技创新计划项目(2011CX01015)罗森林(1968-),男,博士,教授,E-mail:luosenlin126@126.com.李金玉(1987-),女,硕士生
3、,E-mail:ljy1120@126.com.算法第10期第31卷@@[1]ChuW,ChengW,HsuJY,etal.Towardsemanticindexingandretrievalusinghierarchicalaudiomodels[J].MultimediaSystems,2005,10(6):570-583.@@[2]LiQ,MaHD,ZhaoD.Aneuralnetworkbasedframeworkforaudiosceneanalysisinaudiosensornetworks[J].Ad
4、vancesinMultimediaInformationProcessing,2009,5879:480-490.@@[3]BugalhoM,PorteloJ,TrancosoI,etal.Detectingaudioeventsforsemanticvideosearch[C]//Proceedingsof10thAnnualConferenceoftheInternationalSpeechCommunicationAssociation.Brighton,UnitedKingdom:[s.n.],2009:1
5、147-1150.@@[4]SchapireRE.Thestrengthofweaklearnability[J].MachineLearning,1990,5(2):197-227.@@[5]FreundY.Boostingaweaklearningalgorithmbymajority[J].InformationandComputationInformationComputer,1995,12(2):256-285.@@[6]FreundY,SchapireRE.Adecision-theoreticgener
6、alizationofon-linelearningandanapplicationtoboosting[J].JournalofComputerandSystemScience,1997(1):119-139.@@[7]ViolaP,JonesM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C]//ProceedingsofIEEEComputerSocietyConferenceonComputerVisionandPatternRecogni
7、tion.LosAlamitos,USA:[s.n.],2001:511-518.@@[8]SchapireRE,SingerY.Improvedboostingalgorithmsusingconfidence-ratedpredictions[J].MachineLearning,1999,37(3):297-336.@@[9]PikrakisA,GiannakopoulosT,TheodoridisS.Gunshotdetectioninaudiostreamsfrommoviesbymeansofdynami
8、cprogrammingandBayesiannetworks[C]//ProceedingsofIEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing.Piscataway,USA:[s.n.],2008:21-24.特定类型音频流泛化识别方法作者:罗森林,李金玉,潘丽