基于内容的音乐检索研究

基于内容的音乐检索研究

ID:33552193

大小:1.57 MB

页数:30页

时间:2019-02-27

基于内容的音乐检索研究_第1页
基于内容的音乐检索研究_第2页
基于内容的音乐检索研究_第3页
基于内容的音乐检索研究_第4页
基于内容的音乐检索研究_第5页
资源描述:

《基于内容的音乐检索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士论文基于内容的音乐检索研究表整个乐段的信息,必须采用其他的方式来表示音乐。目前最常用的音乐信号表示方法是有序特征向量法,这种方法以帧为单位,对采样点进行各种各样的特征值抽取,产生一组数值表示的、有序的、时间相关的特征向量。从而使音乐信息的存储、查询信息的特征抽取、不同音乐信息相似度的计算等步骤都建立在有序特征向量的基础上。(2)音高:每个人嗓音都各有特点,乐感也不尽相同。因此,客户端识别出的音律与真实旋律之间往往会有较大偏差。最常见的现象就是“走调”:唱一首歌时整体旋律同时升高或降低了八度。在这种情况下,所有音符都会大大偏离标准值,匹配精度无法保证。事实上,

2、我们可以只发送音调的变化信息(音符差)到服务器,这样既提高了识别的鲁棒性,又能减少发送字节数。通常,可以利用三个字符S.same、U.up、D.down,也可以用来表示音乐的旋律轮廓[io】。音乐音调轮廓描述了相对音调的变化,忽略了音乐的节奏信息,也忽略了音调的精确变化。一段旋律中的字符表示当前音符与其前面的音符的比较,S表示音调的重复,U表示比其前面音符的音调高,D表示比其前面音符的音调低。如12233221可以表示为:USUSSDSD。旋律的音调轮廓同样会丢失音乐信息。这样虽然可以减少搜索空间,但同时也使搜索变得不精确,对于一个大型数据库来说查找的结果过多,

3、不利于找到要搜索的目标。为了找到目标歌曲,需要较长的输入串,这会与用户对歌曲的记忆的长度相矛盾。(3)音长:在旋律中,音长具有较强的相对性,同一个音,即使持续时间完全一致,在不同的旋律中仍然有可能让人感觉到长短差异。如果一个音,它周围的其它音节都比它短,那听起来就自然显得长,反之则短。另外音乐是有节奏感的,如何体现出旋律中的节拍?同样一首歌,每个人唱得快慢随意,如何利用音长信息匹配旋律?在设计中采用相对音长编码的手段来解决【111,只考虑相邻两音符之间的音长比。在现有研究中大多用音乐信号的某一种信号特征或几种信号特征的组合来对音调持续时间长短、轻重及音调间的高低

4、变化进行表示。2.2声音信号的处理和分析旋律提取功能模块的主要任务是对输入音频做一系列时域和频域上的信号处理,从中提取出旋律特征,包括组成旋律的每个音符的频率和节奏,最后转换为匹配算法要求的音符序列。2.2.1预处理实际的语音信号常常混杂着强烈的背景噪声及共振峰频率,使语音信号的波形变得非常复杂,这常常给特征的提取造成困难。因此,在分析音乐信号、提取音乐特征2旋律特征的提取硕士论文信号之前,需要预先实施一些经常使用的、共同的短时分析处理,如音乐信号的滤波去噪声、预加重、加窗和分帧等处理【12】。预处理的主要任务就是在特征提取前得到浊音段,并尽量去除背景噪声及共振

5、峰的影响。(1)音乐信号的滤波处理对于由麦克风录音输入的音乐信号,在其由量化转换为数字化的时候会产生量化噪声,同时还会存在电源工频干扰、混叠干扰等。为了减少这些噪声对音乐信号的分析和特征参数的提取产生干扰,首先要对待处理的音乐信号进行滤波处理。可以设计一种带通滤波器来实现滤波处理。(2)音乐信号的预加重处理对于哼唱输入的音乐信号,由于其平均功率谱受到声门激励,以及口鼻辐射的高频端大约在800HZ以上按6dB/倍频程跌落,所以在求语音信号频谱时,频率越高相应的成分越小,高频部分的频谱比低频部分的难求,为此要在预处理过程中进行预加重处理。预加重的目的是提升高频部分,

6、使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。(3)音乐信号的加窗和分帧处理在进行音频特征自动抽取之前,首先要对音频文件做加窗处理,即把音频文件划分成一个个小段,每个小段称为一帧,一般每帧的长度为10-30毫秒,但是为了使帧与帧之间平滑过渡保持其连续性,相邻的两帧之间有几毫秒的重叠。前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为0~1/2,如图2.1所示。渡形0l24567S910ll1213141516时闯(抄)出吕出岜图2.1音乐信号分帧示意图分帧是用可移动的有限长度窗口进行加权的方法来

7、实现的,较常用到的窗函数是矩形窗和汉明窗。窗形的选择对音乐信号分析来说是比较重要的。矩形窗的谱平滑性能较好,但损失了高频成分,使波形细节丢失,而汉明窗则相反。6硕士论文基于内容的音乐检索研究窗函数的选择(形状和长度)对于短时分析参数的特性影响很大。虽然不同的短时分析方法(时域、频域、倒谱分析)以及求取不同的语音特征参数可能对窗函数的要求不尽一样,但一般来讲,一个好的窗函数的标准是:在时域中,因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样就可以使截取出的语音波形缓慢降为零,从而减小语音帧的截断效应;在频域要有

8、较宽的3dB带宽以及较小

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。