资源描述:
《哼唱检索中一种实用哼唱信号处理方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、∀现代电子技术#2010年第10期总第321期计算机应用技术哼唱检索中一种实用哼唱信号处理方法万程程,汪伟,舒棚,张朋,袁锋(武汉科技大学信息科学与工程学院,湖北武汉430081)摘要:设计和实现了一个噪声环境下的哼唱信号处理系统。该系统首先利用减谱法对哼唱信号进行去噪处理,然后采用平均幅度差函数与自相关函数相结合的方法提取基频,再对其进行两次中值平滑处理,最后使用改进的扩窗法切分音符,并将其转化为音高和时间来描述旋律特征。实验结果表明,该系统具有良好的抗噪性,并能将哼唱信息准确有效地
2、转化成旋律特征。在测试的60个歌曲片段中,各种唱法的平均正确率达到了91.4%。关键词:哼唱检索;基音检测;音符切分;旋律描述中图分类号:TP391.3文献标识码:A文章编号:1004373X(2010)10003304PracticalHummingQueryProcessingMethodforQBHSystemWANChengcheng,WANGWei,SHUPeng,ZHANGPeng,YUANFeng(SchoolofInformationScienceandTe
3、chnology,WuhanUniversityofScienceandTechnology,Wuhan430081,China)Abstract:Ahummingsignalprocessingsysteminnoiseenvironmentispresented.First,thespectrumsubtractionmethodisusedtoeliminatethenoiseinthehummingsignals.Then,thepitchisextractedbycombiningtheav
4、eragemagnitudedifferencefunction(AMDF)andtheautocorrelationfunction(AUTOC).Followedwithtwotimesmediansmoothingprocessing,theimprovedmethodofspreadwindowingisadoptedtosegmentnotes.Themusicmelodyarepresentedbythecharacteristicsofpitchandtime.Theexperime
5、ntsresultsshowthatthehummingsignalcanbeconvertedtomelodiccharacteristicsexactlyandeffectively,besideswithwellantinoiseperformance.Amongthe60testedsongssegments,theaveragerightratiocomesupto91.4%.Keywords:querybyhumming;pitchdetection;notessegmentatio
6、n;melodypresentation迷!多模态点歌系统。0引言对哼唱信号进行处理是一个QBH系统的重要组音乐与人的听觉感知紧密相关,它更多的传达了成部分,本文的工作就是对哼唱的音频信号进行处理,一种感情,一种很难量化的情绪。音乐的这种特性决定获取其旋律和节奏信息,并以某种格式描述出来,用于了在音频的分类检索技术中所用到的歌名、演唱者等外音乐检索系统。在信息对音乐分析并不适用,而传统的信息检索技术大1系统构架多正是基于这类文本信息的,诸如Yahoo,Google等各种搜索引擎,就是这方面的典型
7、应用。当用户想搜索某本文设计的噪声环境下哼唱信号处理系统结构如首歌曲,却不知道其歌名、歌手等信息,只能哼唱其中的图1所示,图中左侧为系统构架,中间为具体实现方法,一个旋律片段,若仅利用当前的搜索工具将很难达到搜右侧为各模块作用。整个系统包括哼唱信号的去噪、基[1]索目的。哼唱检索是一类基于内容的音乐检索方式,音检测、后处理、音符切分和旋律描述5个部分。系统它根据用户哼唱的音乐旋律、节奏等内在特征来进行检的关键模块是基音检测和音符切分,其对系统的正确率[2]索,从而有效地解决了上述问题。1995年Ghi
8、as等起着决定性作用。下文将详细介绍系统中的关键技术。展示了首个QBH(querybyhumming)系统,此系统将2关键技术歌曲转换为音调轮廓信息进行匹配,利用三个字符U(升高)、R(重复,即音高不变)、D(降低)来表示音乐的2.1减谱法去噪[3]QBH系统用配置有声卡的个人电脑和普通的麦克旋律轮廓。McNab等人增加了对音乐节奏信息的提[4]风来录音,不可避免地会受到周边噪声以及麦克风中交取,提高了检索成功率。台湾清华大学的张智星等人直接使用基频