ibm数据挖掘技术方案

ibm数据挖掘技术方案

ID:31726513

大小:555.23 KB

页数:25页

时间:2019-01-17

ibm数据挖掘技术方案_第1页
ibm数据挖掘技术方案_第2页
ibm数据挖掘技术方案_第3页
ibm数据挖掘技术方案_第4页
ibm数据挖掘技术方案_第5页
资源描述:

《ibm数据挖掘技术方案》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据挖掘技术方案中国国际商业机器有限公司01/2005目录1.数据挖掘及实施方法学31」什么是数据挖掘31.2与数据挖掘相关的新事物41.3技术类别51.3.1发现挖掘.61.3.2预测挖掘.61.1.数据挖掘的不同运用71.4数据挖掘实施过程及方法学81.4.1第一步:定义业务问题.9142第二步:定义使用的数据模型111.4.3第三步:数据追源和预加工131.4.4第四步:评估数据模型151.4.5第五步:选择数据挖掘技术161.4.6第六步:解释结果171.4.7第七步:部署结果171.5需要的技能181.6工作量要求192.IBM数据挖掘工具202.1.Intelligen

2、tMiner产品202.2.数据挖掘工具(IBMIntelligentMinerforData)212.3.DB2UDB数据挖掘组件232.3.1.DB2IntelligentMinerScoring242.3.2.DB2IntelligentMinerModeling252.3.3.DB2IntelligentMinerVisualization251.数据挖掘及实施方法学作为商业智能总体结构的一部分,数据挖掘是可提供给您的一项主要的应用。您可能已经用过-•系列可提供给您日常所需的信息分析和报告的工具。那为什么数据挖掘会与一般的数据分析和您所用的其他业务报告工具有所不同呢?在这一

3、章里我们将向您描述数据挖掘所涉及的内容,以及利用数据挖掘所提供的工具和技术可完成的工作。了解数据挖掘可完成的工作可以帮助您发现可提出的业务问题的种类,以及您将如何边出挖掘自身业务的第一步。为了能在这一方面给您提供帮助,我们研发了一种通用的数据挖掘方法,可作为您的一种基木工具。这种通用的方法将在后面的几章里进行说明,并介绍如何适用于提岀特殊的零售业务问题。1.1什么是数据挖掘数据挖掘被很多人视为一种哲学体系,或者是数学体系的一个分支,而不是商业问题的一个实际解决方案。对此您可以从对它的各种解释来看出,例如:“数据挖掘是通过自动化或半自动化程序对关于以前未知的、有趣的、可理解的相关性进

4、行的数据探测和分析。”或者“数据挖掘是从数据屮对于固有的、以前未知的潜在有效信息非平凡提取。”虽然以上描述都有一定的道理,但在此我们将着眼于数据挖掘的实用问题,并说明如何让数据挖掘应用于您的零售业。我们尤其想向您介绍一下要想成功挖掘自身业务以及可用于完成零售业绩所必须做的工作。虽然数据挖掘自身是一门学科,但它是在近十年才岀现的,而且它的起源可以追溯到20世纪50年代人工智能的早期发展阶段。在这段I]寸期,模式识别的发展和以推理为基础的规律提供了数据挖掘的奠基石。从这段时间开始,虽然数据挖掘尚未被命名,但我们现在所用的许多技术已经被连续使用,并基本上用于特殊的应用。随着关系数据库的出

5、现及商业组织获取和存储更大的数据量的能力的提高,一系列被用于特殊应用的技术己能适用于商业环境并带来商业利润。数据挖掘一词因此而产生,指这些被用于大容量数据的不同的特殊技术。DataWarehouseDataMiningQuerylanguages在图3-1里介绍了在过去40年的发展情况。I960■197019801990200.1956*AI1961IntegData1965HieraratedStoror

6、tdot.ofDBlanguage图3-1数据挖掘技术发展历史ArtificiaIIntelligenceLearningPatternrecognitionRulebasedreasoning用于数据挖掘的一些技术在计算中是非常复杂的,为了发现在大型数据集中存在的模式,必须进行一系列的计算。在过去的10年中,大型商业数据库(特别是数据仓库)的应用增长、对数据的理解和解释的需要以及低价计算机的可靠性带來了数据挖掘广泛的商业应用。1.2与数据挖掘相关的新事物数据挖掘是指从您所收集数据中发现与业务有关的新事物。您可能会认为您已经利用常规的数据技术在研究数据库。事实上您通常所做的是在提出

7、一个关于业务问题的假设,并且试图通过寻找支持的或者矛盾的数据来证明或否定这一假设。例如,设想作为一个零售商,您认为从乡镇来的客户光顾您城里大型商店的次数少于其他客户,但当他们一旦光顾就会进行大量采购。为了回答这类问题您可以做一个简单的数据库问题公式,例如,您的各家分店、他们所在的区域、销售额、客户,然后将这些必要信息(每个客户每次光顾的平均花费)进行处理,来证明这个假设。然而,这个答案可能只对于少数在周末进行大量购物的乡镇客户来讲是正确的。与此同时,乡镇客户(可能是往

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。