欢迎来到天天文库
浏览记录
ID:9131510
大小:71.00 KB
页数:10页
时间:2018-04-18
《基于数据挖掘的高校图书馆个性化服务研究.》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于数据挖掘的高校图书馆个性化服务研究(新乡医学院,河南新乡43003)摘要:文章简述了数据挖掘技术应用到高校图书馆个性化服务中的几种关键技木,并通过分析其在高校图书馆工作中的应用,来说明数据挖掘对高校图书馆发展的重要性。关键词:数据挖掘;高校图书馆;个性化服务中图分类号:G20.74文献标识码:A文章编号:1007一6921(XX)17—0200—02随着数据库和网络技术应用的不断深入发展,Internet技术和eb技术的日益成熟,个性化服务逐渐成为现代高校图书馆发展的重要趋势之一。个性化服务是根据对读者行为习惯、文化层次和信
2、息需求等信息的分析而主动地向用户提供可能需要的信息或服务。由此可见,如何自动识别用户的信息、目标和计划是实现个性化服务的关键所在。数据挖掘技术是信息识别、数据采集和数据处理技术的典型代表,能对图书馆所存在的潜在信息以及读者的个人信息进行高效的分析并比较准确的预测其发展趋势,对于图书馆个性化服务工作的发展和完善具有重要作用。因此,数据挖掘技术在高校图书馆个性化服务方面的应用已经成为一种必然要求。1应用到图书馆个性化服务中的关键技术1.1关联分析每个数据库中的数据之间都存在着一种潜在关联,关联分析的目的是从数据库中发现隐藏在数据间的
3、关联,从而发现规则并应用到其他数据库中,在不知道数据库中的关联函数或者不确定的情况下,通过关联分析抽取的规则便具有了一定的可信度。例如:通过对读者借阅检索数据进行关联分析,可以发现读者在借阅文献时的其他借阅行为。1.2聚类分析聚类是根据一定规则将数据库中未分类的数据集划分为一系列有意义的集合。集合中的数据具有共同趋势和模式。如果对同一个数据库采用的不同的聚类方法进行划分,则可能得到不同的集合。在同一集合中,数据之间的差别较小,不同集合中数据之间差别较大。通过聚类建立了宏观概念,增强了人们对客观现实的认识[1]。1.3分类分析分类
4、是通过对样本数据库的数据进行分析,准确找出每个类别的概念描述或者建立分析模型,即这类数据库的分类规则或者决策树模式,然后用这个分类规则或决策树模式应用到同类数据库中。是一种有指导的学习。分类方法可用于图书馆读者借阅日志数据的分析,从而得出读者的借阅需求、借阅特征楚/士白芬1日'匕、O1.4预测分析预测是通过对大量历史数据的分析,找出数据的变化规律,建立模型,并用此模型来预测未来数据的种类、特征等。[1]典型方法是回归分析。例如,利用回归分析结合时间序列分析对历史流通流量日志进行分析,可以推算出与往年相同时期的当前流通数量变化数据
5、。2数据挖掘在图书馆个性化服务方面的应用随着网络和数据库技术的飞速发展和广泛应用,高校图书馆正在向信息化和数字化的方向转变,近年来,我国高校加大了对图书馆的投资力度,图书馆的数据库和存储设备不断得到扩充和扩容,网络和服务器得到进一步普及和升级。在这种自动化的网络环境下,数据挖掘技术可以更好的完善高校图书馆个性化服务工作。2.1图书推荐工作中的应用图书推荐工作是高校图书馆个性化服务的一个重要组成部分,是图书馆个性化服务的重要体现之一。通过数据挖掘技术的应用,图书推荐工作可以做的更加有效和快捷。下面简单介绍数据挖掘在图书推荐中的应用
6、流程。2.1.1数据准备数据的准备是数据挖掘的最基础的工作,没有数据,数据挖掘将无用武之地。通过对读者基本信息数据库、读者借阅日志数据库以及其他涉及到读者各种信息的数据库进行选样、整理、数据转换和预处理等数据处理,剔除无效和错误的数据,从而建立挖掘数据库,为数据挖掘做好数据准备。2.1.2数据挖掘和建立模型对挖掘数据库应用关联分析等数据挖掘技术,得到读者的借阅习惯、兴趣模式和阅读趋势等,从而建立读者借阅行为模型。例如:通过对读者的借阅日志进行关联分析,可以发现读者借阅一类图书同时的其他借阅行为和图书文献之间的关联。然后,计算这种
7、关联规则的支持度和置信度,从而建立借阅模式。需要强调的是:挖掘数据库是动态的,它是根据读者行为或兴趣的改变而自动进行数据修改。2.1.3模型的测试建立读者借阅模型以后,就需要测试模型的实用性和有效性。从原始数据库中选出一定比例的数据对模型进行测试。通过读者模型得出的结果与原始数据进行比较,如果模型的准确率大于既定的标准,说明模型有效,否则,就需要重新进行挖掘,建立新的读者借阅模型,直到找到有效的模型为止。2.1.4结果的输出通过测试以后,需要把有效的读者模型直观的表现在读者或者数据库管理者面前,这就需要结合可视化技术,在读者或者
8、图书管理者输入查询条时,通过网页或者专门的数据挖掘系统直观地输出查询结果。同时,也有利于数据库管理员或则决策者对数据库进行直接的数据分析和操作,及时了解用户需求,发现用户的访问习惯和模式以及周期性行为特征,利用推送服务通过图书馆网页为读者提供个性化服务。同时为优
此文档下载收益归作者所有