欢迎来到天天文库
浏览记录
ID:58156206
大小:435.20 KB
页数:2页
时间:2020-04-25
《一种基于机器学习提取多类视频关键帧的方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、一种基于机器学习提取多类视频关键帧的方法一种基于机器学习提取多类视频关键帧的方法MethodforExtractingtheKeyFrameofVariousTypesVideoBasedonMachineLearning宋红玉周浚哲(沈阳理工大学,辽宁沈阳11OOl6)摘要提出了一种不局限于视频种类的关键帧提取方法。这种基于机器学习提取视频关键帧的方法能有效地提取视频的关键部分。与以往传统的抽取关键帧方法相比,此方法不是针对某一类视频而设计的。为验证此方法,首先应用GIST描述符提取每幅图像的GIST特征,然后一个类稀疏模型来判断
2、每幅图像的重要程度,最后选择具有高可靠得分的图像帧作为视频的关键帧,提取的关键帧将用于总结视频的主要内容。该方法仅需要一个模型来完成提取关键帧的工作,而不必为每一类视频都训练一个新模型。关键词:关键帧,不局限于种类,GIST,视频总结AbstractThispaperpresentsanapproachtoabstractthekeyframeofcategory—independencevideointhispaper.Themethodofthispaperbasedonmachinelearningabstractthekey
3、framesthatstandforthevideoIncontrastwithtraditionalkeyframeabstractionmethods,themethodmentionedinthispaperderivethekeyframenotforonetypeofvideo.Toaccom—plishthiswork,atthebeginofexperimentthispaperderivetheGISTfeatureusingtheGISTdescriptor,nextuseacatego—rysparsemodel
4、tojudgetheimpo~anceofeachframe,thenselecttheframewithhighimportancescoreasthekeyframe.Theframeswhichareselectedwillbeusedtosummarizethevideo,Thispaperonlyneedonemodeltoaccomplishtheextraction.whichavoidthetroubletrainanewmodelforeachcategoryKeywords:keyframe,category—i
5、ndependence,GIST,videosummarization本文提出了一种新的提取个人拍摄视频关键帧的方法。个GIST描述符具体查阅参考文献[4]。GIST描述符的优势在于结人拍摄视频提供了从个人视觉来看的世界,这与环境相机拍摄构紧凑且计算速度快。的视频很不相同。环境相机拍摄的视频背景基本是固定的,摄像本篇论文将采用GIST描述符来提取图像的特征并且展示范围也是固定的,变化的是在这背景下的事物。而个人拍摄视频如何提取图像的特征。的背景可以是变化的也可以是不变的。1.2视频总结本文的方法并不是针对一种类型的视频,模型是通用的
6、,它近年来,人们在视频总结方面做了许多工作。总体来看,两能够分析任何类型的视频。这项优势对分析不同类型视频具有类视频总结方式分别为静态视频总结和动态视频总结。参考文很大的吸引力,它仅仅需要创建一个模型来分析视频,而不必分献[1]提出了一种学习类独立的精确定位视频中关键人物与事析一类视频训练一个模型,减少了视频分析的工作量并大大提物的重要线索方法。参考文献[4]提出一个动态视频浏览总结框高了视频分析的效率。架,该框架同时强调了均衡内容覆盖和视觉连贯的重要性。与现1相关工作存方法相比来看,本论文方法将能够轻易地自动发现各类视频1.1Gl
7、ST描述符中的关键帧,更具有通用性。GIST描述符是在参考文献[2]首次提出的。参考文献[4]在2实验方案没有分割场景的前提下提出一个场景的低维表征。作者们提出本论文方法原理如下:首先使用GIST描述符提取每个图一系列场景感知的维度来表征场景主要空间结构分别为自然像的GIST特征,依图像在视频中的次序组成一个GIST特征向度、开放度、粗糙度、膨胀度、险峻度。自然度用于表示场景人工量矩阵。然后应用类稀疏模型对得到的GIST特征向量矩阵进痕迹的多少,通常自然景象具有纹理区域和起伏的轮廓,场景如行分析,提取出一个局部关键视频帧序列,然后通
8、过计算局部关果包含高度的水平和垂直线,这表明该场景有明显的人工痕迹;键帧序列的hsv距离,提取出关键帧。开放度用于表示空间包络是否是封闭(或围绕)的;粗糙度主要实验的目标为生成视频的浓缩版本。浓缩版本包含原始视指主要构成成分颗粒的大小
此文档下载收益归作者所有