基于内容的音频检索系统应用研究

基于内容的音频检索系统应用研究

ID:33300528

大小:2.49 MB

页数:56页

时间:2019-02-23

基于内容的音频检索系统应用研究_第1页
基于内容的音频检索系统应用研究_第2页
基于内容的音频检索系统应用研究_第3页
基于内容的音频检索系统应用研究_第4页
基于内容的音频检索系统应用研究_第5页
资源描述:

《基于内容的音频检索系统应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕士学位论文基于内容的音频检索系统应用研究姓名:林茜卡申请学位级别:硕士专业:计算机应用技术指导教师:傅秀芬20090530摘要随着现代信息技术,特别是网络技术和多媒体技术的迅速发展,大量的数字音频被创造,传输和储存。当今人们面临的问题不再是缺乏多媒体内容,而是如何在海量的数字媒体世界中快速地找到自己需要的信息。音乐家,音效工程师这些专业从业者面临着巨大的挑战,他们必须从海量的,并且快速增大的音频文件集中找到合适的声音。虽然传统的基于文本的音频检索系统能帮助用户寻找音频,但是效果并不理想。用户需要提供关于该音频的文字描述,然后系统给出文本匹配结果,然而,音频文件

2、的手工标注的工作量极大,现有大量的音频都只是用无意义的字母或者数字作为音频的文件名;而且无论多复杂的音频,也只能用一句简单的语句来描述,无法体现多媒体数据相对于文本数据的优势;再者,不精确的命名和标签迫使用户为了获得合适的音频而不得不试听大量的音频文件,这样的基于文本描述的检索方式耗费大量的时间,已经远远不能满足用户的需要。因此我们需要一个有效的基于内容的音频检索系统,这样的音频检索系统根据音频的特征进行检索,能够帮助用户找到合适的候选音频文件。同时还需要加强用户的试听功能,使用户在更短的时间内试听更多的音频,从而达到真正的快速检索音频。所以在本论文中提出一种结合快速试听音

3、频功能的基于内容的音频检索系统。这个基于内容的音频检索系统首先提取音频数据库中的音频的MFCC特征并且存储于数据库中,然后系统给用户提供两种音频查询方式,用户可以通过拟声或者声音绘画的查询方式,对数据库中所有的音频进行检索,接着系统计算音频之间的距离,把音频白组织映射到快速试听界面,供用户快速试听。论文首先分析了基于内容的音频检索系统的国内外现状,详细探讨了相关音频检索的技术,然后针对现有音频检索系统的不足,设计了新型的基于内容的音频检索系统,接着本文结合相关的关键技术和编程技巧,实现了系统的核心模块并进行用户测试。最后总结了本文的研究工作,根据用户测试结果,指出了下一步的

4、工作和研究方向。关键词:音频,检索,基于内容,MFCC,自组织映射,声音绘画AbstractABSTRACTWiththerapiddevelopmentofmodeminformationtechnology,especiallynetworktechnologyandmultimediatechnology,largenumbersofaudiohavebeingcreated,transmittedandstored.Theproblemspeoplearefacingarenolongeralackofmulti-mediacontent,buthowtofmdth

5、einformationtheyneedinthemassiveworldofdigitalmedia.Musicians,soundengineers,andfoleyartistsareconfrontedwiththechallengeofsearchingappropriatesoundsinvastcollectionscontainingthousandsofaudiofiles.Thetraditionaltext—basedaudioretrievalsystemiscapableofhelpinguserwithsearchingaudio,butther

6、esultisunsatisfactory.Usershavetoprovidethedescriptionofacertainaudio,andthenthesystemcomparesthistextdescriptionwithitsdatabaseandofferstheresult.However,theworkloadoflabelingaudioistremendous,alargenumberofaudioareexistwithameaninglessname,whichconsistofrandomcharacterornumber.Furthermor

7、e,nomatterhowcomplicatedtheaudiois,itisdescribedbyasimplysentence.Inaddition,imprecisenamingandtaggingforcesuserstoreviewdozensoffilesinordertopicktherightsound.Traditionaltext-basedaudioretrievalsystem,whichisprovedtobetime-consuming,isfar丘omsatisfactiomThere

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。