基于音视频融合的网球视频检索

基于音视频融合的网球视频检索

ID:36785184

大小:4.42 MB

页数:69页

时间:2019-05-15

基于音视频融合的网球视频检索_第1页
基于音视频融合的网球视频检索_第2页
基于音视频融合的网球视频检索_第3页
基于音视频融合的网球视频检索_第4页
基于音视频融合的网球视频检索_第5页
资源描述:

《基于音视频融合的网球视频检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京理工大学硕士学位论文基于音视频融合的网球视频检索姓名:董晴申请学位级别:硕士专业:检测技术与自动化装置指导教师:王建宇20100620硕士论文基于音视频融合的网球视频检索摘要本文以网球视频为研究对象,检测网球比赛视频中出现的精彩事件,如ACE球、上网球等。并提出了一个网球视频精彩事件检测框架,实现了视频流语义分析、音频流语义分析和音视频特征融合的精彩事件检测三个部分。视频流语义分析包括镜头分类、球员检测、球员跟踪等。镜头分类是网球比赛视频分析的基础,直接决定精彩事件检测的准确性。针对目前现有的

2、镜头分类方法,结合网球比赛视频的特点,提出了一种基于Hough直线检测的镜头分类方法,将镜头分为比赛镜头和非比赛镜头。然后在比赛镜头中利用帧差法提取球员所在位置区域,利用Camshitt算法实现球员跟踪。音频流语义分析包括基于帧的特征提取及基于段的音频分类等。本文先将音频流分段,再对音频段分帧处理,然后提取音频帧的特征参数,包括短时平均能量、短时过零率、MFCC以及差分MFCC等,利用连续隐马尔可夫模型实现对音频段的分类,将音频段分为击球声、欢呼声、解说员激昂解说、解说员平缓解说、背景噪音等五个类

3、别。最后通过比赛镜头的长度、球员位置、球员运动变化、击球声和欢呼声等特征检测出ACE球事件、底线对打事件和上网球事件。综上所述,本文采用音视频融合的方法实现了网球比赛精彩事件自动分析与提取。最后,本文以VisualC++6.0、matlab7.0为开发平台,应用IntelOpenCVLibrary实现了一个网球视频自动分析原型系统。实验表明,本文提出的网球视频语义分析算法具有令人满意的效果。关键词:网球视频,镜头分类,球员检测,球员跟踪,音频分类,精彩事件检测硕士论文AbstractThispap

4、erusestennisvideoasresearchobject,detectstheexcitingeventsoccurredinthetennisvideo,suchasACE,Net-approachandSOon.Andproposesawonderfultennisvideoincidentdetectionframework,containingvisualsemanticanalysis,audiosemanticanalysis,highlightsdetectionbased

5、onthefusionofaudio—visualinformation.Visualsemanticanalysisincludesshotclassification,playerdetection,playertracking.ShotclassificationwhichdirectlydeterminestheaccuracyofexcitingeventdetectionisthefoundationofVideoanalysis.Forthecurrentshotclassifica

6、tion,combinedwiththecharacteristicsoftennisgamevideo,shotclassificationmethodbasedonHoughlinedetectionisproposed.Thelensisdividedintogameandnon-gamecameralens.Andthenextractsthelocationofplayersinthegamelensbytheframedifference,andaccomplishplayertrac

7、kingusingCamshiftalgorithm.Audiosemanticanalysisincludesframe—levelaudiofeaturesextractionandaudioeliprecognition.Thispaperdesignsanalgorithmtoextractaverageshorttimeenergy,shorttimezero—crossingrate,MFCCanddifferenceMFCC.Andthenanaudioclassifierbased

8、oncontinuoushiddenMarkovmodelisrealizedwhichdividesaudioinformationintennisgameintofiveclasses:shots,cheers,excitedcommentary,normalcommentaryandbackgroundnoise.Finally,ACEball,Base-lineRallyandNet-approachCanbeabstractedaccordingtothelengthof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。