图书管理中的数据挖掘系统设计研究

图书管理中的数据挖掘系统设计研究

ID:31181416

大小:105.00 KB

页数:5页

时间:2019-01-07

图书管理中的数据挖掘系统设计研究_第1页
图书管理中的数据挖掘系统设计研究_第2页
图书管理中的数据挖掘系统设计研究_第3页
图书管理中的数据挖掘系统设计研究_第4页
图书管理中的数据挖掘系统设计研究_第5页
资源描述:

《图书管理中的数据挖掘系统设计研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、图书管理中的数据挖掘系统设计研究  【摘要】本文探讨了如何在现有图书数据库管理系统基础上,利用数据挖掘技术和软件技术实现对图书馆各种历史数据的深度分析,以期发现图书、读者及管理者之间的某种联系或规律,为优化馆藏分布,提高图书利用率,提升服务效率等提供参考依据。  【关键词】图书管理数据库数据挖掘  一、引言  依托数据库技术的现代图书管理体系已经成为当前图书管理的主流,数字化的信息采集与存储极大地提高了图书管理的效率,如何深度利用这些数字化信息为图书管理带来更高的效率及决策支撑成为近年来图书管理领域研究的热门,但是由于目前大

2、部分图书馆已经拥有了自己的管理系统,而放弃现有系统进行改造需要投入大量的人力物力,并不可取。因此,本文旨在探讨一种利用现有图书管理系统的数据资源实现深度挖掘分析的可行方法,从而在较少投入的情况下实现对系统效率的提升。  二、数据挖掘及其在图书管理中的应用  数据挖掘(Data5Mining,简称DM)就是从现有大量的数据中提取或者挖掘出人们不易发现的但却存在的有用知识和信息。对于图书管理系统来说,主要是通过大量的图书借阅数据,利用数据挖掘技术对这些数据进行深度分析,从中获取与图书利用率、特定类型读者借阅需求、图书管理效率等相

3、关的信息,为优化馆藏分布、提高图书利用率、提升服务效率等提供参考依据。例如,在高校图书馆,通过借阅数据挖掘不同专业学生对不同类别图书的需求关系,在该需求关系的指导下为不同专业的学生推荐合适的图书,从而提高借阅效率;通过借阅数据挖掘各类图书在不同馆藏数量下的流通情况,从而确定合理馆藏数量,提高流通效率。通常的数据挖掘主要包括特征分析、关联分析、分类预测分析、聚类分析等技术途径。  特征分析是数据挖掘最基本的分析,是通过分析获取数据库中某类数据的一般特征或者汇总。一般情况下,各种类别的基本数据可以通过数据库的查询来获取,然后通过

4、一定的方法,如归纳技术,对这些数据进行泛化或者特征化,最后通过一定的方式将这些数据特征输出,如饼状图、柱状图、曲线、数据表等,形成直观的表现。  关联分析就是寻找数据库中各数据项之间存在的关联规则。关联分析通过关联规则挖掘实现,关联规则一般定义为,对于需要分析的各种项集合,实际数据中一定存在某些事务集合,用事务集中同时包含两项或多项的概率来表示某关联规则的支持度,用包含某项的事务集中同时包含其他项的概率来表示置信度,若设定一定的支持度阈值和置信度阈值,则可判定两项或多项的关联规则。5  分类和预测是两种数据分析形式,可以用于

5、提取描述重要数据类的模型或预测未来的数据趋势。在进行数据分类之前,首先需要建立一个模型,来描述一个数据类或者概念集,例如对于图书管理数据,可以用时间周期和借阅量来描述一个热门书籍的概念集,然后以借阅数据库作为训练数据集,通过查询分析获取该概念集的分类规则、判定树或者数学描述公式等分类判据,通过该分类判据可以判断某类书籍是否属于热门书籍。预测则是通过描述历史数据某种属性的变化曲线或者趋势,然后评估或者预测该属性的可能值或者区间,例如我们针对某类书籍的借阅历史数据,利用回归分析描述借阅量随时间的变化曲线,然后通过对回归曲线的拟合

6、分析,可以预测未来某个时间段的借阅量。  聚类分析就是将物理或抽象对象的组合分组成为由类似对象组成的多个类的过程。由聚类生成的类是一组数据对象的组合,同一类中的对象尽可能相似,而不同类中的对象尽可能相异。聚类不同于分类之处在于,聚类分析事先并不知道可能存在各类数据的特性,而分类分析需要提前确定各数据类的特性。例如在实际图书管理应用中,需要根据读者的阅览量来对读者分类,但是由于各个图书馆的总体借阅数据大相径庭,因此无法预先划定多少浏览量才属于活跃读者,何种为不活跃读者,因此可以对原始数据进行聚类分析,将读者聚类成三类,分别代表

7、活跃、一般和不活跃读者。  三、数据挖掘系统设计  为实现在现有图书管理系统上的数据挖掘分析,需要设计相应的软件系统。软件系统需要解决数据采集、挖掘算法设计、挖掘结果分析和界面设计等问题,总体框架如图1所示。  图1所示系统包含两个数据库,其中原始数据库为已有图书管理系统数据库,该数据库中存放着各种图书管理及借阅信息,是本系统分5析必须使用的原始数据;分析汇总数据库是本系统所使用的数据库,该数据库存放着与原始数据库操作读取、挖掘分析计算、挖掘结果相关的各种数据。两个数据库互相独立,本系统所有操作均不改变原始数据库的结构及数据

8、,需要存储的数据均存放于分析汇总数据库。  考虑到不同的图书管理系统可能采取不同的数据库引擎,因此本系统专门设计了自发现数据读取、原始数据筛选与提取以及原始数据库语义解释三个单元模块来匹配不同的原始数据库引擎及结构。首次使用本系统时,用户首先需要确定原始数据库引擎及数据库名,然后将该信息输

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。