欢迎来到天天文库
浏览记录
ID:22507078
大小:4.64 MB
页数:34页
时间:2018-10-29
《ibm spss modeler 教程-(1)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、IBMSPSSModeler说明数据挖掘和建模数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。数据挖掘解决了一个常见的问题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。金矿无法开采,通常是由于缺乏人力、时间或专业技术。数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有用且有价值的信息,这正是您所需要的“商务智能”。尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。如果您可以使用这些过去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目
2、标- 模型,它包含一组从源数据中抽取的规则、公式或方程式,并允许您通过它们生成预测结果。这正是预测分析的核心。关于预测分析预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事件的可靠结论,帮助制定有效的行动措施。它是以下方面的组合:• 高级分析• 决策优化高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。决策优化确定您的哪些措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。有关预测分析如何工作的深入信息,请访问公司网站 http://www.spss.co
3、m/predictive_analytics/work.htm。建模技术建模技术基于对算法的使用,算法是解决特定问题的指令序列。您可以使用特定算法创建相应类型的模型。有三种主要的建模技术类别,IBM®SPSS®Modeler为每种类别提供了一些示例:• Classification• 关联• 细分(有时称为“聚类”)分类模型使用一个或多个输入字段的值来预测一个或多个输出(或目标)字段的值。这些技术的部分示例为:决策树(C&R树、QUEST、CHAID和C5.0算法)、回归(线性、logistic、广义线性和Cox回归算法)、神经网络、Su
4、pportVectorMachine(SVM)和贝叶斯网络。关联模型查找您数据中的模式,其中一个或多个实体(如事件、购买或属性)与一个或多个其他实体相关联。这些模型构建定义这些关系的规则集。数据中的字段可以作为输入和目标。您可以手动查找这些关联,但关联规则算法可以更快速地完成,并能探索更多复杂的模式。Apriori和Carma模型是使用此类算法的示例。另一种类型的关联模型是序列检测模型,后者可以在按时间建立结构的数据中查找顺序模式。细分模型将数据划分为具有类似输入字段模式的记录段或聚类。细分模型只对输入字段感兴趣,没有输出或目标字段的概念
5、。细分模型的示例为Kohonen网络、K-Means聚类、两步聚类和异常检测等。我如何知道使用哪种技术?有这样种类繁多的技术摆在面前,很难知道从哪里开始解决您的特定问题。幸运的是,IBM®SPSS®Modeler可以通过自动化建模形式替您做出其中的部分决定。这是一种功能强大的技术,它能评估和比较多种不同建模方法,并按有效性顺序对它们进行排序。这样,您可以在单次建模运行中尝试多种方法。自动建模使用说明要启动该应用程序,请从Windows“开始”菜单的SPSSInc程序组中选择IBM®SPSS®Modeler 14.1。几秒钟后,屏幕上将显示
6、主窗口。在数据挖掘过程中的每一个阶段,均可通过IBM®SPSS®Modeler易于使用的界面来邀请特定业务的专家。建模算法(如预测、分类、细分和关联检测)可确保得到强大而准确的模型。模型结果可以方便地部署和读入到数据库、IBM®SPSS®Statistics和各种其他应用程序中。使用SPSSModeler即处理数据的三个步骤。• 首先,将数据读入SPSSModeler,• 然后,然后通过一系列操纵运行数据,• 最后,将数据发送到目标位置。这一操作序列称为数据流,因为数据以一条条记录的形式,从数据源开始,依次经过各种操纵,最终到达目标(模型
7、或某种数据输出)流工作区是IBM®SPSS®Modeler窗口的最大区域,也是您构建和操纵数据流的位置。通过在界面的主工作区中绘制与业务相关的数据操作图表来创建流。每个操作都用一个图标或节点表示,这些节点通过流链接在一起,流表示数据在各个操作之间的流动。在SPSSModeler中,可以在同一流工作区或通过打开新的流工作区来一次处理多个流。会话期间,流存储在SPSSModeler窗口右上角的“流”管理器中。IBM®SPSS®Modeler中的大部分数据和建模工具位于节点选项板中,该选项板位于流工作区下方窗口的底部。例如,可以使用“记录选项”
8、选项板选项卡中包含的节点对数据记录执行操作,如选择、合并和追加等。要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。随后可将各个图标连接以创建一个表示数据流动的流。每个选项板选
此文档下载收益归作者所有