基于clementine的图书馆用户借阅行为的挖掘研究

基于clementine的图书馆用户借阅行为的挖掘研究

ID:19648685

大小:82.50 KB

页数:9页

时间:2018-10-04

基于clementine的图书馆用户借阅行为的挖掘研究_第1页
基于clementine的图书馆用户借阅行为的挖掘研究_第2页
基于clementine的图书馆用户借阅行为的挖掘研究_第3页
基于clementine的图书馆用户借阅行为的挖掘研究_第4页
基于clementine的图书馆用户借阅行为的挖掘研究_第5页
资源描述:

《基于clementine的图书馆用户借阅行为的挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Clementine的图书馆用户借阅行为的挖掘研宄[摘要]本文利用Clementine软件和数据挖掘技术,对高校学生的借阅记录进行分析并挖掘建模,最后挖掘得到更深层次的数据,从而为图书馆管理者提供决策依据,帮助完善高校图书馆的服务功能。[关键词]借阅行为;数据挖掘;Clementine[中图分类号]TP311[文献标识码]A[文章编号]1671-0037(2017)3-79-3MiningStudyoftheLibraryUsers'BorrowingBehaviorbasedonClementineHouSongxia(TianjinTrans

2、portationVocationalCollege,Tianjin300112)Abstract:Thisarticleanalyzesthecollegestudents'borrowingrecordsandminestoestablishmodelsusingClementinesoftwareanddataminingtechnology.Thedeepdataobtainedafterfinalminingguidesthedecisionoflibrary'smanager,andhelpscompletetheservicefunct

3、ionofcolleges1library.Keywords:borrowingbehavior;datamining;Clementine1引言随着网络和计算机数据库技术的飞速发展和在各个领域的广泛应用,现代图书馆正在向着信息化和数字化的方向转变。近些年来,我国加大了对图书馆的投资力度,图书馆的数据库不断更新、存储设备不断扩大,网络环境进一步优化、服务器更加强大。在这种环境下,利用数据挖掘技术可以更好地对图书馆资源进行重组、汇集、抽取和预测;能够更方便快捷地从互联网上采集和转换信息和数据,为图书馆发展提供更好的决策支持,为读者提供个性化服??[1]

4、。数据挖掘技术可以指导图书信息资源的采集。我们可以对图书借阅记录进行数据挖掘,其后能够得到读者借阅图书的使用频率表,然后再对读者进行分类,同时对适合不同类别的读者的图书资源进行聚类,从而快速准确地获得订书目录。馆藏图书数据库(OPAC系统)是图书馆纸质文献资料数据的存储系统,编目员每天对它进行维护,并及时输入各种图书的数据。如果对这些数据进行挖掘可以有针对性地制定馆藏策略,有目的地决策图书馆的建设方向。2图书馆流通数据分析与清洗2.1流通数据结构目前图书馆系统主要有四种数据挖掘模式[2]:①关联规则模式:关联规则模式的数据挖掘过程包括两个环节:一是在

5、大量的信息中找出高频项目;二是通过分析这些高频项目发现其中的关联规则。②聚类模式:聚类模式的作用手段是将分析对象划分成相对同质的组群来进行统计分析,又称为数值分类或者是分类分析,它是基于数据的相似性来收集和分类数据的。③决策树模式:决策树模式属于分类方法中很有代表性的一种。它是基于离散函数值的逼近方法。决策树过程包括两个阶段:一是处理数据,根据归纳算法产生规则以及决策树;二是根据生产的规则和决策树来分析新数据。④贝叶斯模式:贝叶斯模式属于一种统计学方法,它是利用概率统计的方法来进行数据的分类。这种方法使用简单、分类迅速、准确率高,应用比较广泛。图书馆

6、借阅的基本业务数据[3]包括:读者证号、读者姓名、流通日期、读者条码、图书条码、题目、索书号等等。接下来将通过数据挖掘分析探宄不同的读者借阅的图书类型之间有什么关联,借阅的行为是否有一定的规律,能否根据规律制定一些针对性的服务。2.2预处理根据需要,从数据库中抽取书目信息表(biblios,对应的是图书馆每一种图书的marc信息),图书信息表(holding表),图书借还记录表(LOG一CIR),读者信息(READER)。分别对每个表进行预处理删减掉无用项目。3挖掘过程3.1建立数据源视图在clementine中[4],建立数据源是挖掘服务器与数据库

7、建立了访问链路,建立数据源视图是选取了数据库中相关表、字段[5]。Biblios表对应的是图书馆每一种图书的Marc信息,holding表对应图书馆每一册馆藏图书的信息,与biblios表通过bookrecno字段关联,log-dr表对应图书借还记录表,通过读者条码data2字段和图书馆条码data3字段分别和reader表rdid字段、holding表barcode字段关联:reader表对应读者信息:通过读者证号rdid与log-cir关联。图1是各数据表的关联结构03.2建立图书馆借阅数据挖掘的模型根据借阅者自身性别及借阅书籍特点进行分类。分析

8、借阅者的特征,更加方便提供个性化服务。数据源:书目信息表(biblios,对应的是图书馆每一种图书的marc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。