欢迎来到天天文库
浏览记录
ID:34600439
大小:6.70 MB
页数:66页
时间:2019-03-08
《基于点击日志分析地数字图书多侧面搜索系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江大学硕r上学位论文摘要伴随着互联网的蓬勃发展,数字图书馆的优势得到越来越充分的体现,并且得到了各国政府的高度关注。在过去的十多年里,数字图书馆发展迅速,业已成为公众获取知识的重要途径,其中的数字图书搜索则是数字图书馆必须提供的支撑性服务。本文针对数字图书馆中如何利用用户的查询日志来改进数字图书的检索结果进行了深入的研究与开发,以帮助用户有效地使用CADAL数字资源。传统的数字图书检索系统是一种数据单向流动的请求应答模式,需要匹配用户确定的需求。然而现实中用户的需求往往是开放的、变化的、模糊的,在这种场景下,传统的检索只能返回大量的匹配结果,失去了检索行
2、为的意义,因此有必要加以研究改进以提高数字资源的利用率。本文围绕基于多重查询意图的CADAL图书搜索系统的研发,主要工作如下:第一,实现了一种点击流上的基于奇异值分解的隐含查询意图挖掘方法。利用CADAL平台丰富的用户使用日志数据,挖掘用户对检索结果的隐式反馈信息。然后根据挖掘到的用户隐含查询意图实现基于查询词和图书的多重分类,并对不同规模数据集的结果进行了分析比对,最终将其应用到检索过程中以改善检索质量。第二,通过分析CADAL服务平台的实际情况,给出了基于多重查询意图的CADAL图书搜索系统的总体设计、模块划分以及每个模块的功能和流程,并按系统的整体架
3、构给出了系统的技术支撑框架和各部分的技术实现解决方案。基于上述工作,开发了基于多重查询意图的CADAL图书搜索系统,通过多维度的方式向用户提供数字图书多重分类的检索结果。关键词:数字图书馆,信息检索,查询意图,矩阵分解,多侧面AbstractWiththerapiddevelopmentofInternet,theadvantagesofdigitallibrariesbecamemorefullyreflectedandreceivedahighdegreeofattentioninmanycountries.Inthepasttenyears,thef
4、astdevelopmentofdigitallibrariesmakesitbecomeoneofthemostimportantapproachesforpeopletoaccessinformation.Digitalbooksearchisoneoftheprimaryservicesindigitallibrary.Thispaperproposesanin—depthresearchonimprovingdigitallibrarysearchresultstoeffectivelyhelpuserstoUSeCADALdigitalresou
5、rcesbyusinguser’Saccesslogs.Thetraditionaldigitalbooksearchisarequest—responsemodelwithone—wayflowofdataandtherequestsfromusersneedtobeprecise.Butinrealworld,theusers’requestsareoftenopen,changingandambiguous.Inthissituation,traditionalsearchottenretumsalargenumberofmatchingresult
6、s,makingsearchbehaviormeaningless.ThemaincontributionofthispaperindevelopingCADALdigitalbooksystemwithmultiplefacetedqueryintentsisasfollow:firstly,weproposeandimplementamethodofmultiplefacetedqueryintentsminingbasedonSingularvaluedecomposition(SVD)usingclick-throughlogdata.Weextr
7、actimplicitfeedbackinformationfromusers’querylogtOgeneratequery—basedandbook—basedmultipleclassification.WealsoanalyzetheexperimentresultsandapplythisalgorithmtOoursystem.Secondly,byanalyzingtheactualsituationofCADALserviceplatform,we-maketheoverallsystemdesignandfunctionsandproce
8、ssesofeachmodule.Then,accordingto
此文档下载收益归作者所有