欢迎来到天天文库
浏览记录
ID:53033209
大小:295.57 KB
页数:4页
时间:2020-04-14
《商务智能中基于时间序列的模型数据挖掘技术应用研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第35卷第3期大庆师范学院学报Vo1.35No.32015年5月JOURNALOFDAQINGNORMALUNIVERSITYMfly.2015DOI10.13356/j.cnki.jdnu.2095-0063.2015.03.003商务智能中基于时间序列的模型数据挖掘技术应用研究穆俊(临沧师范高等专科学校信息科学与技术系,云南临沧677000)摘要:商务智能中应用时间序列的模型数据挖掘技术成为客户智能体系的重要组成部分。在满足市场需求的同时,促进时间序列的模型数据挖掘技术的不断发展。通过对数据挖掘技术的
2、特点及类型、商务智能、数据挖掘两者之间的关系为研究点,对时间序列的模型进行的建模及数据序列模型数据挖掘技术的实践应用进行系统的分析。关键词:商务智能;时间序列模型;数据挖掘技术作者简介:穆俊(1979一),男,云南临沧人,临沧师范高等专科学校信息科学与技术系讲师,从事计算机应用技术和软件理论及数据挖掘研究。基金项目:云南省教育厅科学研究基金重点项目(2014Z137)。中图分类号:TP311.13文献标识码:A文章编号:2095—0063(2015)03—0009—04收稿日期:2015—02—250引言
3、电子商务设备是一种将传统的商业智能系统连接到网络系统上的一种设备系统,从本质上来说,它仍然是一种商务形式,在多种因素的影响下,该系统逐渐以信息系统为支撑,应用新式的高新技术,在实践中有重要的作用。基于网络系统的有效性,需要将计算机技术、网络技术及数据库技术落实到实处,在监测过程中需要在数据监测过程中应用新技术,采取数据挖掘系统的核心,保证电子商务系统具有智能决策的功能。l数据挖掘技术的特点及类型1.1数据挖掘技术特点所谓数据挖掘指的是从大量、不完全、有噪声和模糊的数据中提取信息,提取的信息具有密闭性的特点
4、,人们事先对信息不知情,但是所有的信息都是潜在的有用的信息。数据挖掘就是通过数据仓库中存储大量数据,利用其他序列模式,在实践发现新的关联模式。从商业的角度来看,数据挖掘是一种信息处理技术,主要特征是对商业数据库中的大量业务数据进行抽取、转换和自主分析,从实践中总结关键性信息,利用多种信息的辅助作用对客户流失原因、交叉信息、风险分析及广告定位进行综合性分析⋯。通过该技术可以将时序、关联等信息进行统一的思考和分析,从而收集相关性内容,保证决策的有效性。1.2挖掘模型的类别根据现有的SQLServer信息服务系
5、统的相关内容需要对数据挖掘模型进行分析,建立数据挖掘立方体,从服务器终端或者客户端构建数据挖掘模型,可以利用在数据挖掘模型首先对各个步骤进行系统的分析。SQLServer服务系统可以对时间序列模型、决策模型及关联模型,进行系统的分析。1.2.1时间序列所谓时间序列指的是按照时间顺序将排列的数据进行组合,资料类型多样,包括:整体型、实用性及货9币型,需要根据信息类型确定可行性方案。时间序列的相似模型是为了支持时间序列相似性的搜索,需要进行类似的查询,其次确定挖掘模型的特点。时间序列的监测方式趋于多样性,包括
6、:分解、平滑指数及随机模型的选择等方面,同时也包括神经网络、智能领域等新的知识体系。根据推理形式需要对时序尝试着进行分析,原有的滑动平均混合模型和变换的DFT模型的相似性较大,都是采用欧几里德模型为相似性评价机构,由于相似性评价函数的本质特征有一定的区别,需要根据长度不等或者取样率不同等因素,确定欧氏距离的长度。时间序列由于自身的特殊性,本质上是由四个部分构成的,分别为长期发展、循环发展、季节变动及不规则变动等方面,由于多种因素的影响,导致时间序列自身存在很多问题,如果时间相隔的距离比较小,则表明相关性较
7、强。时间序列的时间单位是年、月、日,需要根据时间间隔的长短确定单位的应用特征。在时间序列排列过程中不能随意调整项目。1.2.2树算法的应用特征树算法是决策过程中的重要组成部分,该算法的基本原理是以递归式的方式为主,将所有的数据分为若干个子集,每个子集都需要包括目标变量,保证目标变量的可预测性。在每次进行拆分计算时,需要将可预测属性纳入考虑范围内,评价所有的输入属性,如果递归式运算结束了,决策的过程也创建结束。和其他数据挖掘技术相比,决策树算法的特点是可以在短时间内建立模型,由于该计算方式将复杂的程序简单化
8、,创建的模型容易解释。每个根点都有不同的路径,需要对决策树进行分析,按照事例要求确定落叶点的路径,落叶点是决策树中拆分条件的基础,当某个事例落实到叶节点时,需要掌握事例的预测值,进而判断节点的统计值。1.2.3关联规则式算法关联式算法最重要的步骤是计数引擎,是用在挖掘繁琐的工作内容中比较有效的算法。基于关联规则法应用方式的特殊性,需要分两个步骤进行,其一是将繁杂的内容简单化,其二是对该项目生成的项目进行分类收集,不断成关联准则
此文档下载收益归作者所有