互联网视频信息获取技术研究与实现

互联网视频信息获取技术研究与实现

ID:33192630

大小:3.06 MB

页数:59页

时间:2019-02-21

互联网视频信息获取技术研究与实现_第1页
互联网视频信息获取技术研究与实现_第2页
互联网视频信息获取技术研究与实现_第3页
互联网视频信息获取技术研究与实现_第4页
互联网视频信息获取技术研究与实现_第5页
资源描述:

《互联网视频信息获取技术研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文互联网视频信息获取技术研究与实现姓名:易荣锋申请学位级别:硕士专业:模式识别与智能系统指导教师:朱明20100508Jj;:j些摘要近年来随着视频服务网站的蓬勃发展,剥Internet上的视频信息进行数据集成已经成为互联网应用的迫切需求。视频信息分布于于兀数的、结构和内弈互异的网页中,因此,为了扶取互联网视频信息,必须解决以下两个问题:1)如何获取这些存放视频信息的刚页;2)如何从这些网页tl,将视频信息抽取出来。通常这两个问题并不是孤立的。一般而言,针对某一类在结构或内容.卜具有某种特殊性

2、的网页容易设计出较高效的信息抽取方‘法:为了设计高效而可行的信息拙取方法,也要求所处理的网页并不是完全杂乱无章,而是某~类的网页。本文围绕以上两个问题进行了相关研究并提出了解决方案,该方案包括以下两个方面:1)在网页获取方面,本文针对视频服务I叫站的特点,将要获取的嘲页锁定在搜索结果页、视频播放页等两类网页,并研究柑应的获取’h。法。其中搜索结果页的获取主要钳‘对大型视频服务网站,视频播放页获取主要针对小型视频服务网站。搜索绌果页扶取的步骤包括:a)定位web数据库入口:b)用模拟人工操作的方法获得搜索结粜页,进而获得

3、URL纽装机:c)用URL组装机组装不同搜索字对应的搜索结果页的URL,并获驭棚应的搜索结果页。视频播放页获驭步骤为:a)利Hj通用网络爬虫获取网页:b)通过特征脚本URL、播放器父节点的HTML文本、播放页模板集这三个要素的判定,识别网页是否为视频播放页。2)在信启、抽取’方。面,本文结合视频服务网站中搜索结果页的结构特点以及网页的视觉信息,通过改进一般的数据列表贞的信息抽取方法,提出了一种有效的信息抽取方法。该方法首先利用网页视觉信息定位数据区域(dataregion),然后通过子树匹配确定数据区域中所有数据项的p

4、ath,.『舌续网页IJlU可以使用数据项的path抽取出来;结合视频服务例站中视频播放页的特点,通过改进一般的非数据列表页的数据抽取方法,提出了在视步负播放页·I·进行视频信息抽取的方法。该方法通过依次去除背景噪声、随机噪声、残留噪声来实现。上述方法已应用于围家863项目“绝合语义的视频服务网站自动发现与分析评估”,较好地解决了项目中互联网视频信息自动获取的问题,并据此设计实现了友问搜索系统中视频服务互联网视频信息抽取系统、实时视频信息抽驭系统和最热视频信息抽取系统。关键词::红联I叫视频、I劂页抽取、视频搜索、信息

5、抽耿A8STRAC丁ABSTRACTInrecentyears,alongwiththevigorousdevelopmentofwebvideoserviceontheInternet,thevideodataintegl’ationhasbecometheurgentdemandofIntemetapplicationVideoinformationisputatcountlesspages,whosesh’uctureandcontentareverydifferent,therefore,inordertoob

6、taintheInternetvideoinformation,thefollowingtwoquestionsmustbesolvedI)Howtoobtainthesevideoinformationpagewithloose;2)Howwillthesevideoinformationfi'omthewebpagedesignUsuallythesetwoproblemsarenotisolated.Generallyspeaking。it'seasiertodesignarelativelyeffectivei

7、nformationextractionmethodforpageswhosestt‘uctureandcontenthavesomecharactel。isticthannot.InOI‘dertodesignefficientandfeasibleinformationextractionmethod,wealsowantthepagesarenotcompletelydesultorily,butacel’tainkindofwebpages.Basedontheabovetwoproblemstosolve.t

8、hispaperdesignscornpletesolutionsofacquisitionoftheInternetvideoinformation.Theplanincludes:1)Inrespectofpageacquisition,aimin—Patthecharacteristicsofwebvideoservice,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。