欢迎来到天天文库
浏览记录
ID:36422240
大小:6.74 MB
页数:153页
时间:2019-05-10
《基于图学习的Web信息检索技术研究(I)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江大学计算机科学与技术学院博士学位论文基于图学习的Web信息检索技术研究姓名:管子玉申请学位级别:博士专业:计算机科学与技术指导教师:陈纯;卜佳俊20100301塑鲨叁兰堕!:堂垡鲨圣塑矍2)Web2.0社区化标签应用中的个性化文档推荐;传统的信息推荐系统聚焦在评级打分数据上,而社区化标签应用中的标签标注数据是一种不周的且具有特殊图结构的数据。本文提出一种新的基于图的多类关联对象降维(语义空间学习)算法,将用户、标签和文档映射到同一语义空间中,然后根据用户与文档之间的欧式距离来进行文档推荐。3)人
2、脸图像检索与识别:传统的人脸检索和识别研究利用降维技术(子空间学习)来获得入脸图像的高层次特征表达。最近提出的一种基于图的二阶张量子空间学习算法在人脸图像上表现比较出色,但是其时间复杂度比较高。本文提出一种新的基于图的高效二阶张量子空间学习算法,在保证可接受的检索、识别性能的同时,降低了学习子空间映射函数的时间复杂度。4)高质量专业Web资源抓取:聚焦爬虫是从Web上抓取主题相关信息资源的一种重要技术手段。对垂直搜索引擎来讲,最重要的研究问题之一是如何从Web中把高质量的相关资源找出来。本文提出一种
3、新的基于Web图的网页主题质量在线评估算法,并在此基础上设计了一个获取高质量主题相关Web资源的聚焦爬虫。文章最后总结了本文工作,并对基于图学习的Web信息检索技术发展前景进行展望。关键词:Web信息检索,Web2.0,基于图的排序,基于图的降维,信息推荐,人脸图像检索,聚焦爬虫浙江大学博l:学位论文AbstractWiththeproliferationandevolutionofInternetandWorldWideWeb(WWW),WWWhasgraduallybecomeanimporta
4、ntinformationsourceinpeople’Sdailylife.N讯{Njhasbroughtinnewchallengesaswellasopportunitiestotheinformationretrievaltechnology.Inthelastdecade,Webinformationretrievaltcchnologyhasundergoneasignificantdevelopment.Nowadays,informationretrievalhaschangedfr
5、omanacademicdisciplinetothetechnicalfoundationofinformationacquisitionformostpeopleintheworld.ThewidespreadideaofWeb2.0hasmadeWWWnotonlyahugedatabase.butalsoaplatforminwhichuserscanparticipateandcommunicatewithothers.TherapidproliferationofWeb2.0applic
6、ationswillleadtoanewroundevolutionofWebinformationretrievaltechnology.Thisthesisarguesthat,intheageofWeb2.0,Webinformationretrievaltechnologyhasmainlythreeevolutionarytrends:1)Moreflexiblepersonalizedinformationservices.Withrapidincreaseofusers,Web2.0W
7、ebsitespressinglyneedtosatisfyusers’personalizedinformationneeds.However,traditionalWebinformationretrievaltechniquesarenotexpertindealingwiththecomplexdatastructuresinWeb2.0applications.Web2.0applicationsneedmoreflexiblepersonalizedinformationservices
8、,suchasrecommendersystems.2)Moreeffectivemultimediainformationretrievaltechniques.ManyWeb2.0Websitesallowuserstouploadandsharemultimediadatafiles,suchaspicturesandvideos.ThisleadstotherapidgrowthofmultimediainformationontheWeb.Thus,mult
此文档下载收益归作者所有