国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf

国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf

ID:52450365

大小:148.88 KB

页数:3页

时间:2020-03-27

国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf_第1页
国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf_第2页
国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf_第3页
资源描述:

《国内图书馆数据挖掘技术实践应用进展分析_冯研.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2图书馆学研究2011110(应用版)国内图书馆数据挖掘技术实践应用进展分析冯研王馨=摘要>数据挖掘技术近几年在图书馆行业得到不断广泛的应用,文章通过文献计量学、研究方向和算法、应用软件、数据处理和选择及技术应用详情等方面分析图书馆在数据挖掘实践应用方面的进展情况。=关键词>数据挖掘图书馆实践应用Abstract:Inrecentyears,dataminingtechnologyhasbeenwidelyusedinlibrary.Basedonbibliometrics,thepaperdiscu

2、ssesthepracticalapplicationofthetechnologyinthefieldbyanalyzingtheresearchdirectionsandappliedalgorithms,appliedsoftware,dataprocessingandselection,technicalapplicationdetails,etc1Keywords:datamininglibrarypracticalapplication数据挖掘(datamining)就是从存放在数据库、术

3、在图书馆读者分析中的应用6先采用聚类,根据聚类[3]数据仓库或其他信息库中的大量的数据中获取有效的、分析产生的读者数据,再应用关联规则分析。5基于数新颖的、潜在有用的、最终可理解的模式的非平凡过据挖掘的图书部署决策系统设计6采用决策树和聚类分[4]程。它可以帮助决策者分析历史数据及当前数据,并析。大部分关联分析采用最常用的Aprior算法,也有用从中发现隐藏的关系和模式,进而预测未来可能发生FP-Max算法;聚类分析大部分采用SimpleKMeans算法,的行为。近几年,数据挖掘在图书馆行业得到不断广

4、也有用二层SOM算法、Kohonen算法及使用基于目标函泛的应用,更多研究者和管理者关注这个领域的发展:数的模糊聚类算法。决策树采用ID3算法。有的研究探讨利用数据挖掘我们可以获得哪些有价值的、隐含的规了一些算法优化的问题。律和特点?国内图书馆主要应用了哪些技术,取得了3使用软件哪些成果?积累了哪些经验?这些经验会带给我们怎进行数据挖掘一般要使用专业的数据挖掘软件,样的提示?站在这些先行者的肩膀上,我们还可以继根据文献情况,图书馆数据挖掘研究主要使用了以下续哪些实践研究?本文将根据近几年有关数据挖掘的

5、几种软件。文献,总结上述情况,以便开展进一步的研究。311weka1文献计量分析其全名是怀卡托智能分析环境(WaikatoEnvironment在CNKI中国学术期刊网络出版总库中检索近几年国forKnowledgeAnalysis),是一款基于JAVA环境下的机内图书馆数据挖掘研究方面的文献(截止到2011年2器学习软件。官方网站可下载软件和源代码。weka能对月),共得到600多篇论文,83%的文献主要集中在2005数据进行预处理、分类、回归、聚类、关联规则以及在新~2010年,其中有具体实践应用

6、的文献占到全部图书馆的交互式界面上的可视化。开发者可使用Java语言,利数据挖掘研究文献的2611%。可见2005~2010年是图书用weka的架构上开发出更多的数据挖掘算法。[1]馆数据挖掘研究的主要阶段,实践应用的比例偏低。312Clementine2研究方向和算法它是Spss公司推出的企业级数据挖掘产品,提供本文对有具体实践应用的文献内容进行分析,图书包括神经网络、决策树、聚类分析、关联分析、因子馆应用数据挖掘研究主要集中在三个研究方向:关联分分析、回归分析等在内的丰富的数据挖掘模型,通过析、聚

7、类分析和决策树,其中应用关联分析数据挖掘的节点的连接来完成整个数据挖掘过程。文献量占总量的60%,聚类分析的文献量占37%,决313AnalysisServices策树应用比率较低,只占11%。也有些文献综合应用多MicrosoftSQLServerAnalysisServices(SSAS)种手段进行数据挖掘,如5基于weka读者借阅行为分是微软公司提供的数据挖掘平台,允许设计、创建和[2]析6应用了聚类和关联规则两种技术,5数据挖掘技管理包含多维结构,使其包含从其他数据源(例如关RESEARCHO

8、NLIBRARYSCIENCE3[9]系数据库)聚合的数据,并通过这种方式来支持法可以作为书目推荐的实践技术。5最大频繁模式挖OLAP。对于数据挖掘应用程序,AnalysisServices允掘算法进行书目推荐系统的设计与实现6研究了应用许使用多种行业标准的数据挖掘算法来设计、创建和关联规则FP-MAX算法进行书目推荐的方法,并完成[10]可视化从其他数据源构造的数据挖掘模型。了书目推荐系统的设计与实现。314自行开发编程大部分研究应用实例论证了书目推荐

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。