资源描述:
《基于clementine的图书馆流通数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计算机与现代化2010年第4期JISUANJIYUXIANDAIHUA总第176期文章编号:100622475(2010)0420171203基于Clementine的图书馆流通数据挖掘123张文华,蒋年德,王益云(1.东华理工大学图书馆,江西抚州344000;2.东华理工大学信息与电子工程学院,江西抚州344000;3.华东交通大学图书馆,江西南昌330013)摘要:数字图书馆改变了传统图书馆的服务模式,同时也积累了大量的读者信息,为个性化服务提供了数据基础。本文重点研究聚类分析技术及其在图书馆中的应用,利用Clementine的两步聚类模型实现对读者的聚类分析,将读者聚类为消
2、极型、一般型和积极型三种类型,针对不同类型的读者,图书馆可以提供相应的个性化服务。关键词:数字化图书馆;数据挖掘;Clementine中图分类号:TP393文献标识码:Ado:i10.3969/.jissn.100622475.2010.04.046DataMiningonLibraryCirculationDataBasedonClementine123ZHANGWen2hua,JIANGNian2de,WANGYi2yun(1.LibraryofEastChinaInstituteofTechnology,Fuzhou344000,China;2.InstituteofInf
3、ormationandElectronicEngineeringofEastChinaInstituteofTechnology,Fuzhou344000,China;3.LibraryofEastChinaJiaotongUniversity,Nanchang330013,China)Abstract:Digitallibraryhaschangedthetraditionalmodeloflibraryservices,itaccumulatsalargenumberofreadersinformationwhichprovidebasedataforpersonalized
4、service.Thisarticlefocusesonaclusteranalysistechniqueanditsapplicationintheli2brary,usingclementine.stwo2stepclusteringmodelofclusteranalysisonreaders.Readersareclusteredintothreetypes:nega2tivetype,generaltypeandpositivetype,librarycanprovidepersonalizedservicefordifferenttypesofreaders.Keyw
5、ords:digitallibrary;datamining;Clementine数据挖掘工具有许多种,本文选择SPSS公司推出的企0引言业级数据挖掘产品)))Clementine。数据挖掘是通过各种技术来识别隐含在数据之中1Clementine简介有价值的信息。通过数据挖掘提取的信息可应用于很多领域,如决策支持、预测、预报和估计。数据通常数Clementine能够有效地改进企业活动和决策,是量很多,但价值较低,并且以其原始形式显示时并没有一个数据采集工作台,提供了包括神经网络、决策树、什么直接用处。有价值的是隐藏在数据之中的信息。聚类分析、关联分析、因子分析、回归分析等在内的丰
6、在数据挖掘中,将专家的数据知识与计算机用来识别富的数据挖掘模型。它通过节点的连接来完成整个数据底层关系和特性的高级的、主动的分析技术相结数据挖掘过程,完全支持世界通行的跨行业数据挖掘合,才能获得成功。数据挖掘过程是利用历史数据生标准流程(CRISP2DM),并提供了从商业理解、数据成模型,这些模型将在日后用于预测、模式识别以及更理解、数据准备、建立模型、模型评估到结果部署的整多用途。构建这些模型的技术称为机器学习或建模。个数据挖掘过程的项目管理功能和相对应的节点。收稿日期:2009209211作者简介:张文华(19712),男,江西抚州人,东华理工大学图书馆馆员,硕士,研究方向:
7、数据挖掘;蒋年德(19712),男,广西金州人,东华理工大学信息与电子工程学院副教授,博士,研究方向:网络与数据库,计算机图形图像处理;王益云(19732),男,江西万年人,华东交通大学图书馆馆员,硕士,研究方向:电子商务。172计算机与现代化2010年第4期它主要可以用来生成客户档案和客户生命周期、检查资料的类型需求也越来越广泛。因此个性化的信息和预测组织的疏漏、预测未来的趋势、研究响应、分类服务成为了新的发展趋势。个性化服务需要用户的和聚类。兴趣、图书间的关联等信息的支持,而