欢迎来到天天文库
浏览记录
ID:37033083
大小:4.10 MB
页数:81页
时间:2019-05-17
《基于用户个性化的图书搜索引擎的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、财£謂我衫_硕士学位论文I闘參基于用户个性化的图书搜索引擎的研究与实现作者姓名李夕学校导师姓名、职称姚勇副教授企业导师姓名、职称吴春苗高工申请学位类别工程硕士学校代码10701学号1503121824分类号TP39密级公开西安电子科技大学硕士学位论文基于用户个性化的图书搜索引擎的研究与实现作者姓名:李夕领域:计算机技术学位类别:工程硕士学校导师姓名、职称:姚勇副教授企业导师姓名、职称:吴春苗高工学院:计算机学院提交日期:2018年5月ResearchandImplementationofB
2、ookSearchEngineBasedonUserPersonalizationAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinComputerTechnologyByLiXiSupervisor:YaoYongTitle:AssociateProfessorSupervisor:WuChunmiaoTitle:SeniorEngineerMay2018西安电子科技大学学位论文独创性
3、(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研宂工作及取得的研宄成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人己经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一学位论文若有不实之处,本人承担切法律责任。本人签名:日期:_西安电子科技大学关于论文使用授权的说明?.本人
4、完全了解西安电子科技大学有关保留和使用学位论文的规定,即研宄生在校攻读学位期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分内容,允许釆用影印、缩印或其它复制手段保存论文。同时本人保证,结合学位论文研宄成果完成的论、。文发明专利等成果,署名单位为西安电子科技大学本人签名:Ah导师签名:—日期::日期摘要摘要近些年来,互联网的图书资源迅速增加,予以读者丰富多样的选择。与此同时,如何在海量资源中快速准确地找到自己所需的图
5、书,成为用户面临的主要问题。图书领域的垂直搜索引擎应运而生,现已得到广泛应用。然而,传统的图书搜索引擎存在着诸多问题,例如商业气息浓重、查询范围狭窄等,除此之外,更是没有充分考虑用户的个性需求,对于同一查询关键词,一律返回相同的搜索结果列表。因此,本文提出了基于用户个性化的图书搜索引擎的研究方案。首先,本文设定豆瓣读书为唯一数据来源,调用应用开发接口,设计主题网络爬虫,获取了足量的图书数据和用户数据。经过预先处理的真实数据,一方面用于建立词条丰富的索引库,另一方面用于个性化搜索算法的研究。协同标注系统中,用户可以自行定义标签
6、管理资源。标签的灵活性和易用性,使其成为图书资源与用户兴趣产生联系的重要媒介,却也带来了一定的处理成本。为了降低噪声和简化计算,本文采用层次聚类算法,进行了标签聚类,使得用户的偏好更加集中,并且引用聚类结果,构建了相应的用户兴趣模型和文档主题模型。针对用户标签数据稀疏等问题,本文着重分析了用户共有的图书评分,改进了用户相似度计算模型,获取了相似用户推荐的图书标签,将其加入目标用户的兴趣集合,基于协同过滤的思想,发现了用户的潜在兴趣,扩展了用户的兴趣范围。然后,本文选择了检索结果二次排序的机制,将用户兴趣模型融入了传统搜索引擎
7、Xapian,综合文档与用户查询的BM25相关性得分以及文档与用户兴趣的相似性得分,实现了个性化搜索算法。为了验证算法效果,本文展开了多组科学对比实验,从不同方面考察了个性化搜索算法的有效性。最终,借鉴搜索引擎的主流架构体系,本文完成了架构设计、详细设计、功能实现和软件测试的工作。用户登录进入系统,发送查询请求,可以检索自己感兴趣的图书,获得符合兴趣特征的个性化搜索结果。关键词:垂直搜索引擎,个性化搜索引擎,主题网络爬虫,用户兴趣模型,搜索排序机制IABSTRACTABSTRACTTherecentyearshavewitn
8、essedaquickemergenceofbookresourcesintheInternet.Onlinereadersarealsowillinglyofferedwithmuchmoreextensiveandvariouschoices.Atthesametime,howtoge
此文档下载收益归作者所有