欢迎来到天天文库
浏览记录
ID:37185762
大小:640.11 KB
页数:3页
时间:2019-05-21
《基于时间序列模型数据挖掘的商务智能》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、王刚1王元亮2,(1.云南财经大学信息学院,昆明650221;2.云南财经大学档案馆,昆明650221)要:对商务智能、数据挖掘的概念和两者的关系做了简要的描述,并对当前流行的数据挖掘算法做了介绍。通过对某地区一段时期GDP和当地用电的情况进行数据挖掘说明在当今以信息为基础的企业竞争中,商务智能对企业管理者、决策者意义重大。关键词:商务智能;数据挖掘;时间序列模型;SQLServer分析服务摘言子商务系统是一种把传统商业“嫁接”到网络统。虽说从本质上讲它仍是一种商务形式,但特网的介入,使得它采取了一种以高新技术为撑的全新的经济模式。基于因特网的电子商务合
2、了计算机技术、网络技术、数据库技术、存储分析服务提供了时间序列模型、决策树模型、关联规则模型和聚类分析模型的数据挖掘模型。1.1时间序列(Timeseries)时间序列(Timeseries)是指按时间顺序排列的数据集合。它们可以是整型、实型、货币型等。时间序列相似模型就是为了支持时间序列的相似性搜索、进行相似性查询和挖掘的模型。时间序列预测已有不少方法,如分解,指数平滑,随机模型,状态空间模型,贝叶斯模型以及一些新的方法如神经网络、糊逻辑、智能领域的遗传算法和模式识别法等,还有BrankoPecar的APRE(基于认识和推理形式的算法)方法同时对时序预
3、测作了初步的尝试。较早的AR-MA(自回归滑动平均混合)模型和基于傅立叶变换DFT的相似性比较方法都采用欧几里德距离作为时间序列间的相似性评价函数,但是,实际中由于长度不等或取样率不同等问题,使得欧氏距离难以直接应安全防护技术等,尤其在数据检索查询领域提高的要求,往往采用数据挖掘思想实现系统的术,并使电子商务系统具备真正意义上的智策功能。据挖掘是指从大量、不完全、有噪声、模糊、随据中提取隐含在其中的人们事先不知道、但又有用的信息和知识。可以认为,数据挖掘就是掘数据仓库中存储的大量数据,从中发现有意的关联模式和趋势的过程。商业的角度来看,数据挖掘是一种新的
4、商业信技术,其主要特点是对商业数据库中的大量业用。基于外形的B.B.Xia形状匹配法和Landmarks进行抽取、转换、分析和其他模型化处理,从中相似性模型将时间序列的比较转化为字符串的比较,要求领域的针对性比较强,不易推广。一般而言,时间序列具有如下特点:时间序列由四个影响成分所组成,分别是长期趋势(Trend)、循环变动(CyclicalFluctuation)、季节变动(Sea-sonFluctuation)、不规则变动(IrregularFluctuation)。时间序列的各观测值通常自相关,且时间相隔越长,相关程度越小。时间序列的时间单位可以是
5、年、季、月、周、日等,应划分为相同间隔的时间单位。不同时间单位的时间序列可转换为相同时间单位的时间序列。时间序列应依时间顺序排列,不可任意变更。助商业决策的关键性数据。数据挖掘为企业提多商业价值。例如,利用数据挖掘技术解决诸如失分析、交叉销售、风险分析、广告定位、销售预些典型的商业问题。数据挖掘往往是把时序、决类、关联等算法应用到电子商务系统的某一数而分析该数据集的内容,提供智能性的决策。择适当的挖掘模型于SQLServer分析服务构建数据挖掘模型应织数据挖掘源数据、建立数据挖掘立方体、从端或者客户端构建和训练数据挖掘模型、利用掘模型进行预测查询这几个步
6、骤。SQLServer期:2009-04-02修稿日期:2009-06-11介:王刚(1984-),男,湖北潜江人,硕士,研究方向为企业信息化体电力使用规划,计划开发电源计划,便成为政府相关些目标是可预测属性。每一次对树进行拆分,都要评单位须重视的问题。本试验通过对某地区1981年到2003年期间电力负载年数据,通过SQLAnalysisSer-vices所提供的数据挖掘功能建立时间序列预测模型。首先,从SQLServer2005中建立AnalysisSer-vices项目,并将需要操作的数据添加到数据源中。然后“新建数据挖掘结构”,选择“从现有的关系型
7、数据库或数据仓库”,选择“Microsoft时间序列“,确认数据库中的表。在选择变量时,将时间单位(年)为关键字,并选择“GDP”和“供电量”两个变量,因为这是关注的变量。确定后点击挖掘模型查看器,经过计算后产生挖掘图例,如图1所示。价所有的输入属性对可预测属性的影响。当这个递归过程结束时,决策树也就创建完了。与其他数据挖掘算法相比,决策树算法的优势是可以快速创建挖掘模型,并且创建的模型也很容易解释。每一条从根节点到叶节点的路径就是一条规则。基于决策树的智能预测也非常高效。对事例进行预测的过程就是从根节点落到叶节点的路径,所选择的路径是基于决策树中节点的
8、拆分条件的。当某一事例落到一个叶节点时,这个事例的预测值是基于存储在节点的统计值
此文档下载收益归作者所有