高校图书馆图书推荐技术的研究

高校图书馆图书推荐技术的研究

ID:10446374

大小:51.50 KB

页数:3页

时间:2018-07-06

高校图书馆图书推荐技术的研究_第1页
高校图书馆图书推荐技术的研究_第2页
高校图书馆图书推荐技术的研究_第3页
资源描述:

《高校图书馆图书推荐技术的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、高校图书馆图书推荐技术的研究摘要:该文介绍了三种高校图书馆广泛采用的图书推荐技术:基于内容的推荐技术、基于协同过滤的推荐技术和基于关联规则的推荐技术,详细说明了此三项技术的基本原理及步骤,并进行了优劣势分析。中国8/vie  关键词:图书推荐;基于内容;协同过滤;关联规则  中图分类号:TP311文献标识码:A:1009-3044(2017)02-0005-03  近年来,随着图书馆信息化、数字化建设的不断发展,馆际资源共享和优秀数据库的引入分流了部分纸质图书的读者。与此同时,随着电子技术的高速发展,电子书阅读器类应

2、用软件普遍地出现在诸如平板电脑、智能手机等移动终端设备上。凭借操作简单、便于携带、书籍种类丰富等特点,该类应用软件已获得大量用户群。读者们的阅读模式正在发生改变,电子资源对纸质书籍产生着强烈的冲击。  传统的图书查找方式是:读者以关键词进行检索,再从检索结果中筛选感兴趣的书目,或是面对同一领域的大量纸质书籍,逐一筛选感兴趣的书目,但随着图书馆馆藏纸质书籍数量与日俱增,传统图书查找方式的时间消耗也在不断增长,增大了读者查找图书的难度。虽然图书馆在“新书推荐”、“月借阅排行榜”等中为读者提供了图书推荐服务,但所采用的图书

3、推荐方式大多是将特定书目笼统地推荐给所有用户,传统的图书推荐方式对不同读者的针对性较差,个性化图书推荐技术应运而生。  个性化图书推荐技术,通过对图书馆存储的图书流通历史数据进行挖掘和分析,猜测读者喜好和需求、预测读者行为[1],从而有针对性地将不同图书推荐给不同读者,弥补了传统图书推荐方式的不足。  个性化图书推荐技术主要包括基于内容的推荐技术、基于协同过滤的推荐技术和基于关联规则的推荐技术等[2]。  1基于内容的推荐技术  基于内容的推荐技术(Content-basedremendations,简称CB)最早被

4、应用于信息检索和过滤领域[3],其基本原理是:为读者推荐与其借阅历史中书目相似的书目,其基本假设是:“若某读者借阅过某图书,则该读者对与该图书相似的其他图书感兴趣。”  实现基于内容的推荐技术一般包括以下三个步骤[4]:  1)特征抽取  为每本图书抽取出若干特征,用该特征信息来描述图书。抽取的特征包括结构化特征和非结构化特征。结构化特征如书名、作者等,意义明确,可直接使用;非结构化特征,如图书中的具体内容等,意义不明确,不能直接使用,需要进行处理加工。文本类非机构化特征一般采用特征词向量的描述方法。特征词常用TF-

5、IDF[5]统计方法抽取。词频(TermFrequency,简称TF)表示词对该图书的表征特性,如果该词在当前图书中的出现次数多,在整个图书馆其他图书中出现的次数少,则认为该词对于当前图书的表征较好,适合作为当前图书的类别特征;逆向文件频率(InverseDocumentFrequency,简称IDF)即在图书馆所有图书集中出现的逆频,用来表征词语在整个语料库的重要性,该词在馆藏图书中出现的次数越少,则该词在图书中的区分率越高,其重要性也越高。  描述图书,可以利用抽取出的特征为每本图书构建向量空间模型(Vector

6、SpaceModel,简称VSM)。  2)特征学习  利用读者过去喜欢(或不喜欢)的图书的特征数据学习读者对图书的喜好特征。  3)推荐生成  比较目标读者喜好特征与候选图书特征,为目标读者推荐最相似的图书。  利用余弦相似度计算目标读者喜好特征与候选图书的相似性,目标读者[u]喜好构成[U]向量,候选图书[b]向量为[B],则二者的余弦相似度[sim(u,b)]计算方法如公式(1)所示,夹角越小,相似度则越高。  [sim(u,b)=cos(U,B)=U×BU*B](1)  基于内容推荐技术只需考虑目标读者喜好,

7、而不用考虑其他用户喜好,数据源独立。针对新书,也可以很好地进行有针对性的推荐;推荐结果直观,易于解释。不能挖掘读者潜在的喜好点,只是推荐与原有喜好相似的图书,缺乏创新。对于新读者而言,因缺乏其借阅数据将无法向其进行图书推荐。  2基于协同过滤的推荐技术  1992年Goldberg等人为解决资讯过载的问题,在研究型邮件推荐系统Tapestry中提出了协同过滤(CollaborativeFiltering,简称CF)[6],基本思想是利用“人群的智慧”对信息进行过滤,其基本假设是:具有相同或相似兴趣喜好的读者的图书需求

8、也是相似的[7]。  实现协同过滤技术通常需要以下3个步骤[8]:  1)收集读者偏好  收集显性读者反馈和隐形读者反馈。所谓显性读者反馈,是指能够明确反馈读者喜好的信息,但需要读者付出额外的代价,例如读者对图书的评分、评论等。所谓隐性的读者反馈,是指通过对读者行为进行分析和处理获得读者喜好,不需要读者付出额外的代价,是读者在使用网站时产生的数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。