《数据挖掘项目实施》PPT课件

《数据挖掘项目实施》PPT课件

ID:37044240

大小:965.60 KB

页数:41页

时间:2019-05-10

《数据挖掘项目实施》PPT课件_第1页
《数据挖掘项目实施》PPT课件_第2页
《数据挖掘项目实施》PPT课件_第3页
《数据挖掘项目实施》PPT课件_第4页
《数据挖掘项目实施》PPT课件_第5页
资源描述:

《《数据挖掘项目实施》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘原理与SPSSClementine应用宝典元昌安主编邓 松 李文敬 刘海涛 编著电子工业出版社2021/7/172021/7/172本章包括:数据挖掘项目实施步骤123数据挖掘项目周期单击此处添加段落文字内容单击此处添加段落文字内容单击此处添加段落文字内容单击此处添加段落文字内容单击此处添加段落文字内容单击此处添加段落文字内容建立项目和报告处理缺失值导入和导出PMML模型3452021/7/17323.1数据挖掘项目实施步骤23.1.1一般实施步骤一般而言,数据挖掘项目要经历的过程包括:问题理解和提出、数据准备、数据整理、建立模型、评价和解释等一系列任务,其流程

2、如图23-1所示。2021/7/1723.1.2企业解决方案23.1.2.1SEMMA模式2021/7/1723.1.2.2SPSS-5A模型2021/7/1723.1.3标准过程模型商业理解数据理解数据准备建立模型模型评估模型发布2021/7/17723.2数据挖掘项目周期2021/7/1723.3建立项目和报告23.3.1项目概述表面上,Clementine项目只是一种组织输出的简单方式,但实际上它能做更多的工作,主要包括以下工作:(1)注释项目文件中的每个对象。(2)使用CRISP-DM方法指导数据挖掘工作。项目还包含CRISP-DM帮助系统,该系统针对使用CRI

3、SP-DM进行的数据挖掘提供详细信息以及现实示例。(3)将非Clementine项目添加到Clementine项目,如用于展现数据挖掘目标的PowerPoint幻灯片或与计划使用的算法相关的文档等。(4)根据注解生成全面更新报告和简单更新报告。为了便于在局域网上发布,可以用HTML的形式生成这些报告。2021/7/1723.3.1.1CRISP-DM视图2021/7/1723.3.1.2类视图2021/7/1723.3.2建立项目23.3.2.1新建项目在Clementine窗口中新建项目非常简单。可以从构建新项目开始(如果没有项目打开),也可以关闭现有项目并重新开始。

4、从流工作区菜单中,选择“文件”→“工程”→“新建工程...”命令。2021/7/1723.3.2.2添加到项目创建或打开项目后,便可以使用多种方法来添加对象,如数据流、节点和报告等。(1)用管理器添加对象使用Clementine窗口右上角的管理器,可以添加流或输出。从其中一个管理器选项卡中选择一个对象(如表或流)。右键单击,然后选择“添加到工程”命令。如果以前保存过该对象,则会自动将它添加到适当的对象文件夹(在类视图中)或默认的阶段文件夹(在CRISP-DM视图中)。或者,可以将对象从管理器拖放到项目工作区中。将项目添加到项目工程中,如图23-7从项目管理器中加入项目项

5、到工程中所示。2021/7/17(2)从工作区添加节点可以使用“保存”对话框从流工作区添加单个节点。在工作区中选择一个节点。单击右键,然后选择“保存节点”命令;或者,从菜单中选择“编辑”→“节点”→“保存节点...”命令。在“保存”对话框中,选中“将文件添加到工程”命令。为节点创建名称,然后单击“保存”命令。从流工作区中加入节点的主要操作对话框如图23-8从流工作区中加入节点所示,这样会保存文件并将其添加到项目中,同时节点会被添加到类视图中的Nodes文件夹以及CRISP-DM视图中的默认阶段文件夹。2021/7/17(3)添加外部文件将外部文件添加到项目的一般步骤如下

6、:Step1.将文件从桌面上直接拖到项目中;或右键单击CRISP-DM视图或类视图中的目标文件夹。Step2.从菜单中,选择“添加到文件夹”命令。Step3.在对话框中选择一个文件,然后单击“打开”命令。这将会在Clementine项目内添加对所选对象的引用。2021/7/1723.3.2.3设置项目属性可以使用项目属性对话框来自定义项目的内容和文档。要访问项目属性,一般执行以下操作:Step1.右键单击项目工具中的根文件夹,然后选择“工程属性”命令;或者右键单击项目工具中的非根文件夹,然后选择“工程”→“工程属性”命令。工程选项卡对话框如图23-9工程选项卡对话框所示

7、。Step2.单击“工程”选项卡以指定项目的相关信息。2021/7/17在工程选项卡中包含下列信息,如图23-9工程选项卡对话框所示。创建时间:显示项目的创建时间(此项内容不可编辑)。摘要:可以输入将在项目报告中显示的数据挖掘项目的摘要。内容:列出项目文件引用的组成文件的类型和数量(此项内容不可编辑)。将未保存的对象保另存为单选项:指定是应将未保存的对象保存到本地文件系统还是存储在PredictiveEnterpriseRepository中。载入项目时更新对象引用复选框:选中此选项可更新项目对其组成文件的引用。2021/7/1723.3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。