欢迎来到天天文库
浏览记录
ID:10446374
大小:51.50 KB
页数:3页
时间:2018-07-06
《高校图书馆图书推荐技术的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、高校图书馆图书推荐技术的研究摘要:该文介绍了三种高校图书馆广泛采用的图书推荐技术:基于内容的推荐技术、基于协同过滤的推荐技术和基于关联规则的推荐技术,详细说明了此三项技术的基本原理及步骤,并进行了优劣势分析。中国8/vie 关键词:图书推荐;基于内容;协同过滤;关联规则 中图分类号:TP311文献标识码:A:1009-3044(2017)02-0005-03 近年来,随着图书馆信息化、数字化建设的不断发展,馆际资源共享和优秀数据库的引入分流了部分纸质图书的读者。与此同时,随着电子技术的高速发展,电子书阅读器类应
2、用软件普遍地出现在诸如平板电脑、智能手机等移动终端设备上。凭借操作简单、便于携带、书籍种类丰富等特点,该类应用软件已获得大量用户群。读者们的阅读模式正在发生改变,电子资源对纸质书籍产生着强烈的冲击。 传统的图书查找方式是:读者以关键词进行检索,再从检索结果中筛选感兴趣的书目,或是面对同一领域的大量纸质书籍,逐一筛选感兴趣的书目,但随着图书馆馆藏纸质书籍数量与日俱增,传统图书查找方式的时间消耗也在不断增长,增大了读者查找图书的难度。虽然图书馆在“新书推荐”、“月借阅排行榜”等中为读者提供了图书推荐服务,但所采用的图书
3、推荐方式大多是将特定书目笼统地推荐给所有用户,传统的图书推荐方式对不同读者的针对性较差,个性化图书推荐技术应运而生。 个性化图书推荐技术,通过对图书馆存储的图书流通历史数据进行挖掘和分析,猜测读者喜好和需求、预测读者行为[1],从而有针对性地将不同图书推荐给不同读者,弥补了传统图书推荐方式的不足。 个性化图书推荐技术主要包括基于内容的推荐技术、基于协同过滤的推荐技术和基于关联规则的推荐技术等[2]。 1基于内容的推荐技术 基于内容的推荐技术(Content-basedremendations,简称CB)最早被
4、应用于信息检索和过滤领域[3],其基本原理是:为读者推荐与其借阅历史中书目相似的书目,其基本假设是:“若某读者借阅过某图书,则该读者对与该图书相似的其他图书感兴趣。” 实现基于内容的推荐技术一般包括以下三个步骤[4]: 1)特征抽取 为每本图书抽取出若干特征,用该特征信息来描述图书。抽取的特征包括结构化特征和非结构化特征。结构化特征如书名、作者等,意义明确,可直接使用;非结构化特征,如图书中的具体内容等,意义不明确,不能直接使用,需要进行处理加工。文本类非机构化特征一般采用特征词向量的描述方法。特征词常用TF-
5、IDF[5]统计方法抽取。词频(TermFrequency,简称TF)表示词对该图书的表征特性,如果该词在当前图书中的出现次数多,在整个图书馆其他图书中出现的次数少,则认为该词对于当前图书的表征较好,适合作为当前图书的类别特征;逆向文件频率(InverseDocumentFrequency,简称IDF)即在图书馆所有图书集中出现的逆频,用来表征词语在整个语料库的重要性,该词在馆藏图书中出现的次数越少,则该词在图书中的区分率越高,其重要性也越高。 描述图书,可以利用抽取出的特征为每本图书构建向量空间模型(Vector
6、SpaceModel,简称VSM)。 2)特征学习 利用读者过去喜欢(或不喜欢)的图书的特征数据学习读者对图书的喜好特征。 3)推荐生成 比较目标读者喜好特征与候选图书特征,为目标读者推荐最相似的图书。 利用余弦相似度计算目标读者喜好特征与候选图书的相似性,目标读者[u]喜好构成[U]向量,候选图书[b]向量为[B],则二者的余弦相似度[sim(u,b)]计算方法如公式(1)所示,夹角越小,相似度则越高。 [sim(u,b)=cos(U,B)=U×BU*B](1) 基于内容推荐技术只需考虑目标读者喜好,
7、而不用考虑其他用户喜好,数据源独立。针对新书,也可以很好地进行有针对性的推荐;推荐结果直观,易于解释。不能挖掘读者潜在的喜好点,只是推荐与原有喜好相似的图书,缺乏创新。对于新读者而言,因缺乏其借阅数据将无法向其进行图书推荐。 2基于协同过滤的推荐技术 1992年Goldberg等人为解决资讯过载的问题,在研究型邮件推荐系统Tapestry中提出了协同过滤(CollaborativeFiltering,简称CF)[6],基本思想是利用“人群的智慧”对信息进行过滤,其基本假设是:具有相同或相似兴趣喜好的读者的图书需求
8、也是相似的[7]。 实现协同过滤技术通常需要以下3个步骤[8]: 1)收集读者偏好 收集显性读者反馈和隐形读者反馈。所谓显性读者反馈,是指能够明确反馈读者喜好的信息,但需要读者付出额外的代价,例如读者对图书的评分、评论等。所谓隐性的读者反馈,是指通过对读者行为进行分析和处理获得读者喜好,不需要读者付出额外的代价,是读者在使用网站时产生的数
此文档下载收益归作者所有