基于Weka 读者借阅行为分析

基于Weka 读者借阅行为分析

ID:39402199

大小:310.00 KB

页数:9页

时间:2019-07-02

基于Weka 读者借阅行为分析_第1页
基于Weka 读者借阅行为分析_第2页
基于Weka 读者借阅行为分析_第3页
基于Weka 读者借阅行为分析_第4页
基于Weka 读者借阅行为分析_第5页
资源描述:

《基于Weka 读者借阅行为分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于weka读者借阅行为分析*基金项目:国家社科基金“自动文本分类技术研究”项目资助(编号:08CTQ003);广东省哲学社会科学基金项目“开源软件与数字图书馆建设探讨”资助(编号:06M03)。作者简介:储文静,女,07级图书馆学研究生;奉国和(1971-),男,博士,副教授,研究方向为数据挖掘、数字图书馆。储文静奉国和华南师范大学经济与管理学院,广州510006[摘要]图书管理系统借阅数据直接反映了读者的借阅行为,对其研究可以了解读者的借阅习惯。使用weka软件,运用其关联分析、聚类中的不同算法对华南师范大学

2、08年研究生图书借阅数据进行分析,获取了一些有益的分析结果,对提高图书馆的服务起到一定的帮助作用。[关键词]Weka借阅数据借阅行为分析[分类号]G252AnalysingLibraryUserlendingBehaviorBasedonWEKA(SchoolofEconomicsandManagement,SouthChinaNormalUniversity,Guangzhou,510006)ChuWenjingFengGuoheAbstract:Datamanagementsystemtoborrowbook

3、sdirectlyreflectsthereader'sborrowingbehavior,theresearchcanunderstandthereader'sborrowinghabits.Usewekasoftware,usetheircorrelationanalysis,clusteringofthedifferentalgorithmsontheSouthChinaNormalUniversitygraduatein2008toborrowbookstoanalyzethedatatoobtainso

4、meusefulresultsoftheanalysis,toimprovelibraryservicestohelpplayarole.Keywords:weka;borrowingdata;analysisoflendingbehavior数据挖掘(DataMining,DM),又称数据库中的知识发现(KnowledgeDiscoveryfromDatabase),是从大量不完全的、有噪声的、模糊的和随机的实际应用数据中,提取隐含的、未知的和潜在有用的信息的非平凡的过程[[]JiaweiHan,Micheli

5、neKamber范明,孟小蜂译.数据挖掘概念和技术.北京:机械工业出版社,2001.]。数据挖掘就是通过分析存在于数据库里的数据来解决问题。例如,在激烈竞争的市场上,客户忠诚度摇摆问题就是一个经常提到的问题[[]IanH.Witten,EibeFrank董琳,邱泉译.数据挖掘实用机器学习技术.北京:机械工业出版社,2006:2]。但若采用数据挖掘技术,发现顾客的行为模式,并采取相应的策略,这样可以提高客户的忠诚度。同样,图书馆的宗旨是为读者服务,如何利用图书馆管理系统中大量的借阅数据,发掘出读者借阅行为模式,以指

6、导图书馆的读者服务工作,是十分值得我们研究的课题。本文采用理论与实践相结合的研究方法,应用weka中的聚类、关联规则技术,并依据华南师范大学图书馆2008年研究生的借阅记录,挖掘出图书馆读者借阅行为中隐含的规律,以指导图书馆的采购、馆藏、咨询等业务工作。1确定数据挖掘目标依据华南师范大学图书馆管理系统中08年所有研究生的借阅数据,约有20万条样本记录,属性分别为性别、工作单位、职业(专业)、中图分类法类号(索书号)、书名、借阅日期、还书日期、馆藏地等8个字段。为了方便关联规则的数据挖掘工作,依据《中国图书馆分类法

7、》第四版,对图书的索书号进行了二级类目归总,增加一个变量,名称为二级类目,如A1,A2,B1,B2等中图法的二级类目。本文对华南师范大学2008年研究生借阅数据进行分析,以期9达到以下数据挖掘目标。(1)进行聚类分析,对这段时间内,读者主要集中借阅了哪些文献,哪些类的文献借阅频率较高,以及借阅文献的用户都集中在哪些院系,借阅的文献都集中在哪些学科馆。(2)用关联规则对这些借阅数据进行分析,从中发现读者对图书的借阅模式,如果发现有很多读者阅览了A文献同时也会阅览B文献,则向阅览A文献的读者推荐B文献。这些规则的发现

8、对提高数据资源的利用率和为读者提供个性化服务有着重要的意义。(3)同时关联规则可获得某主题文献与有关院系或单位间的关联度,以及哪些院系的文献借阅是相似的,哪些用户大量借阅了该类书籍并制定对策[[]王伟,张征芳,王海明.基于数据挖掘的图书馆读者行为分析.现代图书情报技术,2006(11):51-54]。(4)通过关联规则可挖掘出读者借阅频率较高的图书类型的关键词、编著者信息

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。