基于点击日志分析地数字图书多侧面搜索系统研究

基于点击日志分析地数字图书多侧面搜索系统研究

ID:34600439

大小:6.70 MB

页数:66页

时间:2019-03-08

基于点击日志分析地数字图书多侧面搜索系统研究_第1页
基于点击日志分析地数字图书多侧面搜索系统研究_第2页
基于点击日志分析地数字图书多侧面搜索系统研究_第3页
基于点击日志分析地数字图书多侧面搜索系统研究_第4页
基于点击日志分析地数字图书多侧面搜索系统研究_第5页
资源描述:

《基于点击日志分析地数字图书多侧面搜索系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学硕r上学位论文摘要伴随着互联网的蓬勃发展,数字图书馆的优势得到越来越充分的体现,并且得到了各国政府的高度关注。在过去的十多年里,数字图书馆发展迅速,业已成为公众获取知识的重要途径,其中的数字图书搜索则是数字图书馆必须提供的支撑性服务。本文针对数字图书馆中如何利用用户的查询日志来改进数字图书的检索结果进行了深入的研究与开发,以帮助用户有效地使用CADAL数字资源。传统的数字图书检索系统是一种数据单向流动的请求应答模式,需要匹配用户确定的需求。然而现实中用户的需求往往是开放的、变化的、模糊的,在这种场景下,传统的检索只能返回大量的匹配结果,失去了检索行

2、为的意义,因此有必要加以研究改进以提高数字资源的利用率。本文围绕基于多重查询意图的CADAL图书搜索系统的研发,主要工作如下:第一,实现了一种点击流上的基于奇异值分解的隐含查询意图挖掘方法。利用CADAL平台丰富的用户使用日志数据,挖掘用户对检索结果的隐式反馈信息。然后根据挖掘到的用户隐含查询意图实现基于查询词和图书的多重分类,并对不同规模数据集的结果进行了分析比对,最终将其应用到检索过程中以改善检索质量。第二,通过分析CADAL服务平台的实际情况,给出了基于多重查询意图的CADAL图书搜索系统的总体设计、模块划分以及每个模块的功能和流程,并按系统的整体架

3、构给出了系统的技术支撑框架和各部分的技术实现解决方案。基于上述工作,开发了基于多重查询意图的CADAL图书搜索系统,通过多维度的方式向用户提供数字图书多重分类的检索结果。关键词:数字图书馆,信息检索,查询意图,矩阵分解,多侧面AbstractWiththerapiddevelopmentofInternet,theadvantagesofdigitallibrariesbecamemorefullyreflectedandreceivedahighdegreeofattentioninmanycountries.Inthepasttenyears,thef

4、astdevelopmentofdigitallibrariesmakesitbecomeoneofthemostimportantapproachesforpeopletoaccessinformation.Digitalbooksearchisoneoftheprimaryservicesindigitallibrary.Thispaperproposesanin—depthresearchonimprovingdigitallibrarysearchresultstoeffectivelyhelpuserstoUSeCADALdigitalresou

5、rcesbyusinguser’Saccesslogs.Thetraditionaldigitalbooksearchisarequest—responsemodelwithone—wayflowofdataandtherequestsfromusersneedtobeprecise.Butinrealworld,theusers’requestsareoftenopen,changingandambiguous.Inthissituation,traditionalsearchottenretumsalargenumberofmatchingresult

6、s,makingsearchbehaviormeaningless.ThemaincontributionofthispaperindevelopingCADALdigitalbooksystemwithmultiplefacetedqueryintentsisasfollow:firstly,weproposeandimplementamethodofmultiplefacetedqueryintentsminingbasedonSingularvaluedecomposition(SVD)usingclick-throughlogdata.Weextr

7、actimplicitfeedbackinformationfromusers’querylogtOgeneratequery—basedandbook—basedmultipleclassification.WealsoanalyzetheexperimentresultsandapplythisalgorithmtOoursystem.Secondly,byanalyzingtheactualsituationofCADALserviceplatform,we-maketheoverallsystemdesignandfunctionsandproce

8、ssesofeachmodule.Then,accordingto

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。