欢迎来到天天文库
浏览记录
ID:10486208
大小:56.00 KB
页数:5页
时间:2018-07-06
《商业智能软件在汽车销售中的应用 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、商业智能软件在汽车销售中的应用 一、商业智能软件在汽车销售中的应用之引言 在激烈的市场竞争环境中,一个企业如果要生存和发展,就必需了解市场,了解客户,树立“以市场为导向,以客户为中心”的经营理念。汽车销售企业作为服务业尤其如此,面对瞬息万变的市场,多变的客户,应用信息技术为营销服务,建立客户关系管理系统等不失为有效途径。而数据挖掘技术在客户分析方面有优势。在营销过程中市场调查是十分重要的,市场调查将为营销策略,广告的投放提供依据,面对市场调查取得的大量纷杂、无序的数据,利用商业智能软件的数据挖掘技术进行处理,将会起到良好的结果。 二、商业智能软件 商业智能(BI,BusinessI
2、ntelligence),又称商务智能,就是一种将数据转变为信息、信息转变成知识的工具,并且这种工具能够在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人。商业智能定义为下列软件工具的集合。 1.简单的查询和报告工具。 专门用来支持初级用户的原始数据访问,不包括适用于专业人士的成品报告生成工具。在这一层次,商业智能仅仅是把信息进行粗加工。 2.在线分析处理 提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。 3.经理信息系统。 这类系统的用户希望能够在不太费力的情况下,从系统中获取大多数信息。 4.数据集市和数据仓库产品。 包括数据清洗、数据抽取、转换、
3、载入、数据管理和数据存取等方面的软件。 5.数据挖掘(DataMining)软件。 使用诸如决策树、神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、模式和趋势的过程。它使用模式认知技术、统计技术和数学技术。数据挖掘的目的是为决策建模,即根据过去活动的分析预测将来的行为。比较常见的数据挖掘算法有:聚类分析、决策树、神经网络、规则归纳。一般比较好的数据挖掘工具都会支持这几种算法。 三、决策树与IBMDB2IntelligentMiner 决策树方法起源于概念学习系统,然后发展了ID3方法并达到高峰,最后又演化为
4、能处理连续属性的C4.5。 决策树构造的输入是一组带有类别标记的数据,构造的结果是一棵二叉或多叉树。二叉树的内部节点(非叶子节点)一般表示为一个逻辑判断,如形式为(ai=vi)的逻辑判断,其中ai是属性,vi是该属性的某个属性值;树的边是逻辑判断的分支结果。多叉树的内部节点是属性,边是该属性的所有取值,有几个属性值,就有几条边。树的叶子节点都是类别标记。 构造决策树的方法是采用自上而下的递归构造。以多叉树为例,它的构造思路是:如果训练数据集合中的所有数据是同类的,则将之作为叶子节点,节点内容即是该类别标记,否则,根据某种策略选择一个属性;按照属性的各个取值,把数据集合划分为若干子集合,
5、使得每个子集上的所有数据在该属性上具有同样的属性值;然后再依次递归处理各个子集。这种思路实际上就是“分而治之”(Divide-and-conquer)的道理。二叉树的原理与此的差别仅在于要选择一个好的逻辑判断。 在生成的决策树中可以建立一个规则基。一个规则基包含一组规则,每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条连接。 IBM的IntenlligentMiner是市场上最强大和最有可伸缩性的工具之一,正在竞争数据挖掘工具市场的领导地位,它提供了最广泛的数据挖掘技术和算法,在数据规模和计算性能方面具有非常高的可伸缩性;IntellligentMiner支
6、持分类、预测、关联规则、聚类、顺序模式侦测和时间序列分析的算法。IntenlligentMiner支持DB2关系数据库管理系统,并集成了大量复杂的数据操纵函数。 根据IDC的统计,IntelligentMiner目前是数据挖掘领域最先进的产品。大多数算法是由IBM研究所研发出的,是IBM的专有技术,并只存在于IntelligentMiner中。决策树使用的是CAU算法的二种变种,用以产生一个分类模型并且能够处理离散和连续数据。 四、决策树技术在汽车销售中的应用 下面将就某汽车销售公司,在汽车展上的调查问卷进行分析。潜在客户的数据主要有年龄、性别、职业、收入、教育程度、是否结婚,是否有
7、房等,调查客户是否会在一年内买车。数据表格式如下: 1.汽车销售的数据预处理。 数据预处理的目的是为了提高数据质量,使数据挖掘的过程更加有效,更加容易,同时也提高挖掘结果的质量。数据预处理的对象主要是清理其中的噪声数据、空缺数据和不一致数据。常用的数据预处理技术主要包括:数据清洗、相关分析和数据变换等。 数据清洗试图填补训练集中的空缺值、识别孤立点、消除噪声、纠正数据中的不一致。对于空缺值的处理,通常有忽略元组、人
此文档下载收益归作者所有