基于图学习的web信息检索技术研究

基于图学习的web信息检索技术研究

ID:33184889

大小:7.02 MB

页数:161页

时间:2019-02-21

基于图学习的web信息检索技术研究_第1页
基于图学习的web信息检索技术研究_第2页
基于图学习的web信息检索技术研究_第3页
基于图学习的web信息检索技术研究_第4页
基于图学习的web信息检索技术研究_第5页
资源描述:

《基于图学习的web信息检索技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学计算机科学与技术学院博士学位论文基于图学习的Web信息检索技术研究姓名:管子玉申请学位级别:博士专业:计算机科学与技术指导教师:陈纯;卜佳俊20100301浙江人学博上学位论文摘要随着互联网和万维网(WorldWideW曲)的快速繁荣发展,万维网逐渐成为人们生活中不可或缺的一种信息获取来源。万维网给信息检索技术带来了极大的机遇和挑战。经过最近十几年的发展,信息检索已经由一个纯粹的学术研究学科转变成大多数人信息获取的技术基础。随着Web2.0概念的普及和发展,万维网不再仅仅是一个巨大的信息库,更逐渐成为一个用户参与和交流的平台。

2、Web2.0应用网站的蓬勃发展将再次推动信息检索技术的革新。本文认为,在Web2.0时代,信息检索技术主要有以下三方面的发展趋势:11更加灵活的个性化信息服务。随着用户的急剧增加,Web2.0网站迫切需要满足用户的个性化信息需求。然而,传统的Web信息检索技术并不擅长处理Web2.0应用的复杂结构数据。Web2.0需要更加灵活的个性化信息服务,如信息推荐系统。2)更加有效的多媒体数据检索技术。随着Web2.0的普及,用户可以很方便地上传和分享多媒体信息。多媒体数据的迅速增多使得多媒体信息检索技术成为人们关注的焦点。3)检索服务的专业化

3、。当前,Web2.0应用中的用户产生数据已经成为万维网这个巨大信息库的重要组成部分之一。过于繁杂的Web数据使得Web信息检索向领域化、专业化方向发展。很多Web数据呈现复杂的内在关联结构。本文指出,为了更好地解决这些数据上的相关检索问题、提升检索效果,就需要充分利用蕴含在数据复杂关联结构中的知识。图学习技术能够对复杂关联结构进行较好地建模并捕捉其中蕴含的知识。因此,结合上述发展趋势,本文研究工作围绕基于图学习的Web信息检索技术展开,具体在以下四个相关研究问题上进行深入研究并提出了新颖的图学习算法:1)Web2.0社区化标签应用中的

4、个性化标签推荐:社区化标签应用中用户可以对资源任意地加标签。产生的标签标注数据可以很自然地用图来建模。本文提出一种新的基于图的多类关联对象查询排序算法,以解决社区化标签应用中的个性化标签推荐问题。塑鲨叁兰堕!:堂垡鲨圣塑矍2)Web2.0社区化标签应用中的个性化文档推荐;传统的信息推荐系统聚焦在评级打分数据上,而社区化标签应用中的标签标注数据是一种不周的且具有特殊图结构的数据。本文提出一种新的基于图的多类关联对象降维(语义空间学习)算法,将用户、标签和文档映射到同一语义空间中,然后根据用户与文档之间的欧式距离来进行文档推荐。3)人脸图

5、像检索与识别:传统的人脸检索和识别研究利用降维技术(子空间学习)来获得入脸图像的高层次特征表达。最近提出的一种基于图的二阶张量子空间学习算法在人脸图像上表现比较出色,但是其时间复杂度比较高。本文提出一种新的基于图的高效二阶张量子空间学习算法,在保证可接受的检索、识别性能的同时,降低了学习子空间映射函数的时间复杂度。4)高质量专业Web资源抓取:聚焦爬虫是从Web上抓取主题相关信息资源的一种重要技术手段。对垂直搜索引擎来讲,最重要的研究问题之一是如何从Web中把高质量的相关资源找出来。本文提出一种新的基于Web图的网页主题质量在线评估算

6、法,并在此基础上设计了一个获取高质量主题相关Web资源的聚焦爬虫。文章最后总结了本文工作,并对基于图学习的Web信息检索技术发展前景进行展望。关键词:Web信息检索,Web2.0,基于图的排序,基于图的降维,信息推荐,人脸图像检索,聚焦爬虫浙江大学博l:学位论文AbstractWiththeproliferationandevolutionofInternetandWorldWideWeb(WWW),WWWhasgraduallybecomeanimportantinformationsourceinpeople’Sdailylife

7、.N讯{Njhasbroughtinnewchallengesaswellasopportunitiestotheinformationretrievaltechnology.Inthelastdecade,Webinformationretrievaltcchnologyhasundergoneasignificantdevelopment.Nowadays,informationretrievalhaschangedfromanacademicdisciplinetothetechnicalfoundationofinformat

8、ionacquisitionformostpeopleintheworld.ThewidespreadideaofWeb2.0hasmadeWWWnotonlyahugedatabase.butalsoaplatform

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。