SPSSClementine决策树建模在图书馆中的应用

ID：46285086

大小：78.50 KB

页数：8页

时间：2019-11-22

资源描述：

《SPSSClementine决策树建模在图书馆中的应用》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、SPSSClementine决策树建模在图书馆中的应用SPSSClementine决策树建模在图书馆中的应用摘要：分析影响读者借阅量的因素，确定不同读者的借阅需求，进而依据需求定制差异化的借阅权限和服务。利用SPSSClementine挖掘工具，采用C5.0决策树算法，对国际关系学院图书馆的读者借阅数据进行挖掘，建立读者决策树分类模型，将读者按借阅频度分为活跃读者、一般读者和沉默读者。结果表明，读者身份、专业、年级和性别对借阅量有重耍影响，本科大三学生借阅需求较大,大四学生借阅需求小。决策树分类能对图书馆读者进行细分，可为调整读者借阅权限提供理论依据。关键词：决策树；分类；图书馆；Cleme

2、ntine；借阅权限中图分类号:TP391文献标志码:A文章编号：1006-8228(2014)04-30-04Abstract：Thefactorsinfluencingreaders，borrowingamountareanalyzedanddifferentreaders，borrowingdemandaredetermined.Thedifferentialborrowingauthorityandservicearecustomized.AdecisiontreeclassificationmodelofreaderborrowingfrequencyisbuiltwithC5・0

3、inminingtoolofSPSSClementine・Thedecisiontreeclassifiesreadersintothreegroups：activingreaders,commonreadersandsilentreaders・Themineddatacomefromreaderborrowingrecordsofthelibraryofuniversityofinternatiormlrelations.Theresultsshowreaders'identity,major,gradeandgenderhaveanimportanteffectonborrowingam

4、ount.Theborrowingdemandofjuniorstudentsisgreat,whilethatofseniorstudentsissmal1.Thelibraryreadersmaybeclassifiedbyreferingtodecisiontreeclassificationtoprovidetheoreticalevidentforadjust!ngborrowingauthority・Keywords：decisiontree；classification；library；Clementine；borrowingauthorityo引言数据挖掘能从大量数据中发现有

5、用的知识，目前己成功应用于各个领域。图书馆系统积累了大量读者数据，研究如何将数据挖掘有效地用于图书馆［1-4］,变数据为知识，从而更好地为读者服务，是数据挖掘和图书馆工作者的共同责任。决策树分类是数据挖掘中的一种重要方法，该方法通过对已有数据的学习，识别影响对象分类的若干因素，构建一个决策树分类模型,对对象进行分类。文献［5-6］为决策树在图书馆读者借阅数据中的应用实例，其中文献［5］利用C4.5算法，对306条读者借阅记录进行了分类建模，利用学历、专业和年级三个属性，构建借阅次数（高/中/低）分级模型，得出的结论为：学历是第一决定因素，其次是专业和年级，研究生和大四学生借阅量低等。笔者认为

6、文献［5］挖掘的数据量过小，不具有足够的说服力，•且借阅次数分级采取主观划分的方法,缺乏依据。文献［6］利用ID3算法，对1969条研究生的借阅记录进行了分类建模，利用读者是否为新生、是否为工程类学生、性别和距离图书馆的远近等属性，构建决策树模型，得出的结论为：读者是否为新生为第一决定因素，其次为是否工程类、距离远近和性别，一年级新生离图书馆近的、高年级工科学生为活跃读者等。笔者认为文献［6］的数据只覆盖研究生读者，样本不全，且模型仅从训练数据构建，没有测试数据测试，使模型的普适性受到怀疑。另外，文献［5-6］没有对具体所用挖掘工具的介绍。针对上述研究背景，本文使用SPSSClementin

7、e软件，采用基于C5.0的决策树分类算法，对国关图书馆的4366条读者借阅记录进行建模。建模过程综合考虑读者身份、专业、年级、性别、民族和索书号等因素，构建读者借阅频度决策树分类模型，分析影响读者借阅量的主要因素，给出针对不同读者群的借阅权限分配和服务建议。作为数据挖掘在图书馆的进一步应用探索，木文一方面可为国际关系学院图书馆开展实际业务工作提供帮助；另一方面可为其他高校图书馆开展挖掘实践，提供方法和过程指导

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 8



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

SPSSClementine决策树建模在图书馆中的应用

SPSSClementine决策树建模在图书馆中的应用

相关文章

相关标签