关联规则挖掘在高校图书馆馆藏分布中的应用

关联规则挖掘在高校图书馆馆藏分布中的应用

ID:15374573

大小:111.00 KB

页数:6页

时间:2018-08-03

关联规则挖掘在高校图书馆馆藏分布中的应用_第1页
关联规则挖掘在高校图书馆馆藏分布中的应用_第2页
关联规则挖掘在高校图书馆馆藏分布中的应用_第3页
关联规则挖掘在高校图书馆馆藏分布中的应用_第4页
关联规则挖掘在高校图书馆馆藏分布中的应用_第5页
资源描述:

《关联规则挖掘在高校图书馆馆藏分布中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、关联规则挖掘在高校图书馆馆藏分布中的应用收稿日期:作者简介:文蓉(1974-),女,湖南省长沙,湖南财经高等专科学校讲师。联系电话:(0731-6736800)、(0731-8854854),联系地址:湖南省长沙市枫林二路139号湖南财经高等专科学校信息管理系(410205)。EMAIL:hnwh74@163.com;第二作者:贺铁祖(1972-),男,湖南省宁乡人,湖南财经高等专科学校馆员文蓉贺铁祖(湖南财经高等专科学校,长沙410205)摘要数据挖掘技术在图书馆中的应用是现代图书馆发展的一个关键技术,而关联规则挖掘技术是处理此类问题最合适的

2、方法之一。本文探讨了关联规则在高校图书馆管理中的一个实际应用。运用Apriori算法挖掘读者的特征规则,详细阐述了数据选取过程、数据挖掘等一整套流程,这对新建图书馆在馆藏分布方面的科学决策具有一定的指导意义及现实意义。关键词数据挖掘关联规则Apriori算法高校图书馆馆藏分布中图法分类号文献标识码近年来,计算机信息技术的迅速发展极大地推动了高校图书馆的现代化进程。“一切为读者,为一切读者,满足读者对图书馆的需求”是现代图书馆的服务宗旨。高校图书馆是学校文献最集中的部门,藏书基本囊括了学校各专业领域以及其他相关专业,以便于为全校师生提供教学、科研

3、等服务。由于藏书种类繁多,科学合理的馆藏分布对于优化馆藏建设十分重要。根据现有的数据预测未来的发展趋势是实现科学合理的馆藏分布的重要途径,可方便读者进行借阅,主动提高图书馆的服务质量,以适应现代图书馆的发展需求。有专家预测,数据挖掘技术在图书馆中的应用是现代图书馆发展的一个关键技术。数据挖掘的技术手段有很多种,如分类、回归分析、聚类、关联规则等,而关联规则挖掘技术应该是处理此类问题最合适的方法[1]。1关联规则挖掘技术关联规则挖掘是从大量数据项中发现有趣的关联或相关联系,其典型例子就是购物篮分析,该过程通过发现顾客放入其购物篮中不同商品之间的联

4、系,分析顾客的购买习惯。1.1关联规则的定义根据R.Agrawal等对关联规则挖掘技术的阐述[2],关联规则的定义如下:关联规则是形如的蕴含式。设I={i1,i2,……in}是事务项集合,其中ik(k=1,2,……n)称为项(item),项的集合叫做项集(itemset)。设D={d1,d2,……dm}是与任务相关的数据库事务的集合,其中di(i=1,2,……m)称为事务(Transactions),每个di是项的集合,使得diI。每个事务都有一个标识符Tid。设A是一个项集,事务di包含项集A当且仅当Adi。关联规则是形如的蕴含式,其中,并且

5、。Support(Confidence()支持度Support(是表示的交易在整个交易库中所占的比例。可信度Confidence表示支持的交易在支持A的交易中所占的比例,满足最小支持度阈值min_sup和最小可信度阈值min_conf的规则就是强关联规则。在事务数据库中挖掘关联规则的任务就是在其中找出所有满足用户指定最小支持和最小可信度的强关联规则。1.2关联规则挖掘的Apriori算法Agrawal等人在1993年提出的Apriori算法是一种最有影响的挖掘关联规则频繁项集的算法[3]。Apriori算法具有如下特征,即频繁项集的所有非空子集

6、都必须也是频繁的。它利用频繁项集性质的先验知识,使用逐层搜索的迭代方法:K-项集用于搜索(K+1)-项集。首先,找出频繁1-项集的集合。该集合记作L1,它用于找频繁2-项集的集合L2,而L2用于找L3,如此下去,直到不能找到频繁K-项集。找每个LK需要扫描数据库一次。Apriori算法主要是在遍历的基础上进行关联规则的挖掘。其具体算法如图1所示描述如下:令K-属性序列集为具有K个属性的集合,LK为频繁k-属性序列集,而CK为候选K-属性序列集。图1Apriori算法算法中apriori_gen()函数产生候选,做两个动作:连接和剪枝。在连接部分

7、,Lk-1与Lk-1连接产生可能的候选。剪枝部分使用Apriori性质删除具有非频繁子集的候选。Subset()函数用来找出事务中是候选的所有子集,并对每个这样的候选累加计数计算支持度。最后,所有满足最小支持度的候选集合形成频繁项集L,然后由频繁项集产生关联规则。2关联规则挖掘技术的应用关联规则挖掘技术的应用过程,简单来说,也就是数据挖掘中一个特定算法应用于系统的过程,主要包括定义问题、数据准备、执行挖掘算法、结果分析和表示这个几个阶段。现以其在湖南财经高等专科学校图书馆(简称湖南财专图书馆)中的具体应用来说明。2.1定义问题湖南财专图书馆自2

8、001年开展图书馆自动化工作以来,采、编、流等各项日常工作均采用计算机完成,大大提高了工作效率和质量。目前图书馆购置的自动化管理系统ILASⅡ能较好地

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。