音频指纹搜索中数据预处理的改进算法

音频指纹搜索中数据预处理的改进算法

ID:37124390

大小:628.34 KB

页数:5页

时间:2019-05-18

音频指纹搜索中数据预处理的改进算法_第1页
音频指纹搜索中数据预处理的改进算法_第2页
音频指纹搜索中数据预处理的改进算法_第3页
音频指纹搜索中数据预处理的改进算法_第4页
音频指纹搜索中数据预处理的改进算法_第5页
资源描述:

《音频指纹搜索中数据预处理的改进算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ComputerEngineeringandApplications计算机工程与应用2010,46(21)145音频指纹搜索中数据预处理的改进算法关耀铧,申凌,吴云,赵勇GUANYao-hua,SHENLing,WUYun,ZHAOYong北京大学深圳研究生院集成微系统重点实验室,广东深圳518055KeyLabofIntegratedMicrosystems,ShenzhenGraduateSchool,PekingUniversity,Shenzhen,Guangdong518055,ChinaE-mail:wuyun_v@

2、126.comGUANYao-hua,SHENLing,WUYun,etal.Improvedalgorithmofdatapreprocessinginaudiofingerprintsearch.Com-puterEngineeringandApplications,2010,46(21):145-147.Abstract:DifferentAudioFingerprint(AF)featureextractionalgorithmsrequiredifferentAFsearchingalgorithms.Forsomes

3、pecificAFfeatureextractionalgorithms(e.g.foosicalgorithm),indataprocessing,twonewAFsearchingalgorithmsarepro-posedandimplemented:PrincipleComponentAnalysis(PCA)algorithmandsumofthecorrespondingdatabetweendifferentframesalgorithm.Theexperimentalresultsshowthatapplying

4、PCAalgorithm,theaccuracyis94.98%whilethesearchtimeisaslowas8.42%;applyingsumalgorithm,theaccuracyis95.92%whilethesearchtimeisaslowas3.72%.Keywords:audiofingerprintsearch;PrincipleComponentAnalysis(PCA)algorithm;sumalgorithm;datapreprocessing摘要:不同的音频指纹提取算法需要不同的音频指纹搜索。

5、针对某些特定(例如:foosic算法)的音频指纹提取算法,在数据预处理方面提出并实现了两种新的音频指纹搜索算法:PCA(PrincipleComponentAnalysis)主成分分析算法、不同帧之间相应的数据求和算法。实验结果表明:应用PCA算法,在搜索正确率为94.98%的情况下,搜索时间缩短为8.42%;应用求和算法,在搜索正确率为95.92%的情况下,搜索时间缩短为3.72%。关键词:音频指纹搜索;主成分分析算法;求和算法;数据预处理DOI:10.3778/j.issn.1002-8331.2010.21.041文章编号

6、:1002-8331(2010)21-0145-03文献标识码:A中图分类号:TN912.3音频指纹是指从一段音频采样中提取的独特的信息,1音频指纹数据提取方法与搜索流程可以用于辨识不同的声音采样,是一项基于内容的识别技术1.1音频指纹数据提取方法(Content-BaseIdentification,CBID)。从相同采样不同编码格所用的音频指纹提取算法在文献[7]中有详细介绍,下文式的音频文件提取的音频指纹信息是相似的。一个好的音频仅简述跟搜索算法关系紧密的部分。以下用歌曲作为音频文指纹搜索系统[1]应该具备下列特点:快速、

7、正确匹配、节省存储件来进行研究。空间、数据库容易更新。在一首歌曲的开始部分截取一定长度(比如90s)的数据,分音频指纹技术的研究内容主要包括:音频指纹提取和音为87帧。每帧分别做处理,得到17个(fit部分16个,dom部分1频指纹搜索。音频指纹提取已经有很多成熟的算法,如Mel个)[7]数据。因此每首歌的音频指纹数据共有17×87个数据。每频率倒谱系数提取(Mel-FrequenceCepstralCoefficients,MF-一首歌的音频指纹数据由两部分组成:fit数据和dom数据。CC)[2],频谱平坦量测值(Spect

8、ralFlatnessMeasure,SFM)[3]数据读到内存中时,fit部分数据存放格式为16行×87列。等。针对特定音频指纹提取算法的搜索算法有基于PCA的算每一列是一帧的数据,是同一个时间不同频带的数据,每一法[4-5],基于ANN(Approximat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。