欢迎来到天天文库
浏览记录
ID:37124390
大小:628.34 KB
页数:5页
时间:2019-05-18
《音频指纹搜索中数据预处理的改进算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ComputerEngineeringandApplications计算机工程与应用2010,46(21)145音频指纹搜索中数据预处理的改进算法关耀铧,申凌,吴云,赵勇GUANYao-hua,SHENLing,WUYun,ZHAOYong北京大学深圳研究生院集成微系统重点实验室,广东深圳518055KeyLabofIntegratedMicrosystems,ShenzhenGraduateSchool,PekingUniversity,Shenzhen,Guangdong518055,ChinaE-mail:wuyun_v@
2、126.comGUANYao-hua,SHENLing,WUYun,etal.Improvedalgorithmofdatapreprocessinginaudiofingerprintsearch.Com-puterEngineeringandApplications,2010,46(21):145-147.Abstract:DifferentAudioFingerprint(AF)featureextractionalgorithmsrequiredifferentAFsearchingalgorithms.Forsomes
3、pecificAFfeatureextractionalgorithms(e.g.foosicalgorithm),indataprocessing,twonewAFsearchingalgorithmsarepro-posedandimplemented:PrincipleComponentAnalysis(PCA)algorithmandsumofthecorrespondingdatabetweendifferentframesalgorithm.Theexperimentalresultsshowthatapplying
4、PCAalgorithm,theaccuracyis94.98%whilethesearchtimeisaslowas8.42%;applyingsumalgorithm,theaccuracyis95.92%whilethesearchtimeisaslowas3.72%.Keywords:audiofingerprintsearch;PrincipleComponentAnalysis(PCA)algorithm;sumalgorithm;datapreprocessing摘要:不同的音频指纹提取算法需要不同的音频指纹搜索。
5、针对某些特定(例如:foosic算法)的音频指纹提取算法,在数据预处理方面提出并实现了两种新的音频指纹搜索算法:PCA(PrincipleComponentAnalysis)主成分分析算法、不同帧之间相应的数据求和算法。实验结果表明:应用PCA算法,在搜索正确率为94.98%的情况下,搜索时间缩短为8.42%;应用求和算法,在搜索正确率为95.92%的情况下,搜索时间缩短为3.72%。关键词:音频指纹搜索;主成分分析算法;求和算法;数据预处理DOI:10.3778/j.issn.1002-8331.2010.21.041文章编号
6、:1002-8331(2010)21-0145-03文献标识码:A中图分类号:TN912.3音频指纹是指从一段音频采样中提取的独特的信息,1音频指纹数据提取方法与搜索流程可以用于辨识不同的声音采样,是一项基于内容的识别技术1.1音频指纹数据提取方法(Content-BaseIdentification,CBID)。从相同采样不同编码格所用的音频指纹提取算法在文献[7]中有详细介绍,下文式的音频文件提取的音频指纹信息是相似的。一个好的音频仅简述跟搜索算法关系紧密的部分。以下用歌曲作为音频文指纹搜索系统[1]应该具备下列特点:快速、
7、正确匹配、节省存储件来进行研究。空间、数据库容易更新。在一首歌曲的开始部分截取一定长度(比如90s)的数据,分音频指纹技术的研究内容主要包括:音频指纹提取和音为87帧。每帧分别做处理,得到17个(fit部分16个,dom部分1频指纹搜索。音频指纹提取已经有很多成熟的算法,如Mel个)[7]数据。因此每首歌的音频指纹数据共有17×87个数据。每频率倒谱系数提取(Mel-FrequenceCepstralCoefficients,MF-一首歌的音频指纹数据由两部分组成:fit数据和dom数据。CC)[2],频谱平坦量测值(Spect
8、ralFlatnessMeasure,SFM)[3]数据读到内存中时,fit部分数据存放格式为16行×87列。等。针对特定音频指纹提取算法的搜索算法有基于PCA的算每一列是一帧的数据,是同一个时间不同频带的数据,每一法[4-5],基于ANN(Approximat
此文档下载收益归作者所有