时序数据库中的数据挖掘研究

时序数据库中的数据挖掘研究

ID:38270257

大小:94.18 KB

页数:3页

时间:2019-05-26

时序数据库中的数据挖掘研究_第1页
时序数据库中的数据挖掘研究_第2页
时序数据库中的数据挖掘研究_第3页
资源描述:

《时序数据库中的数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第13卷 第5期微 机 发 展Vol.13No.52003年5月MicrocomputerDevelopmentMay2003时序数据库中的数据挖掘研究蒋良孝,蔡之华(中国地质大学计算机科学与技术系,湖北武汉430074)摘 要:时序数据库中的某个字段的值是随着时间而不断变化的,例如股票价格每天的涨跌、浏览网页的次序等。文章运用数据挖掘的方法来对这些数据库进行趋势分析、时序分析、序列模式挖掘以及周期分析。关键词:时序数据库;数据挖掘;趋势分析中图分类号:TP3111138      文献标识码:A      文章编号:1005-3751

2、(2003)05-0090-03TheResearchofDataMininginTime2SeriesDatabasesJIANGLiang2xiao,CAIZhi2hua(DepartmentofComputerScienceandTechnology,ChinaUniversityofGeosciences,Wuhan430074,China)Abstract:Thevalueofonefieldintime2seriesdatabasesvarieswithtime.Forexample,therisingorfallingof

3、thestockpriceofeveryday,theorderofthebrowsedWebpages,andsoon.Thepaperappliedthemethodsofdataminingtothesedatabasesinordertocarrythroughtrendanalysis,time2seriesanalysis,sequencepatternminingandperiodanalysis.Keywords:time2seriesdatabases;datamining;trendanalysis0 引 言我们怎么

4、样来分析这些时间序列的数据呢?目前一在数据挖掘的过程中,有时需要对时序数据库进行数般有四种主要的变化或成分用于特化时序数据:据挖掘。所谓时序数据库就是指由随时间变化的序列值①长期或趋势变化:它反映的是在很长一段时间内总或事件组成的数据库。时序数据库中的数据的值一般是的走向趋势,这种走向可以用一个“趋势曲线”或者“趋势在等时间间隔采集的数据。时序数据库的应用非常广泛,直线”来显示,具体方法将在下面讲到。如股票或证券市场的每日波动、动态产品加工过程的质量②循环变化:主要指循环性,直线和曲线在长时间内变化、科学实验、医疗研究等等。下面详细阐述

5、了时序数呈摆动迹象,它可以是也可以不是周期性的,即在等时间据库中的数据挖掘的几个非常重要的方面。间隔之间,循环不需要沿着同样的模式演进。③季节性变化:它反映的是每年都重复出现的事情,1 趋势分析如在情人节来之前,巧克力和花的销量突然增大。即在连设一个时序变量Y,表示某一支股票每天的收盘价,续的很多年中,有一段时期总是与这年中的其他时期不它可以看作是时间t的函数,即Y=F(t)。这样的函数可同。以用一个如图1所示的时间序列图来表示。④不规则或随机变化:它反映的是由一些随机或突发的偶然事件而产生的零星时序变化,如劳工纠纷、洪水或企业人事变动

6、等。上面这些走向我们分别可以用变量T,C,S,I来表示,时间序列分析也就是将一个时间序列的数据分割成这四个基本的趋势。时间序列变量Y就可以模化为这四个变量的乘积或者总和,其选择通常是凭经验的。给定Y的集合,我们怎么样来分析数据的走向呢?一图1AllElectronics公司股票价格随时间变动的时间序列图个很普遍的方法就是计算它的n阶的移动平均(movingaverageofordern):收稿日期:2002-11-20y1+y2+⋯+yny2+y3+⋯+yn+1,,基金项目:湖北省自然科学基金项目资助(2001ABB006)nn作者简介

7、:蒋良孝(1977—),男,湖南衡阳人,硕士研究生,研究方向y3+y4+⋯+yn+2,⋯为数据挖掘。n©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.第5期               蒋良孝等:时序数据库中的数据挖掘研究·91·如果在上述序列中使用加权算术平均,则称为n阶3 序列模式挖掘的加权移动平均(weightedmovingaverageofordern)。序列模式挖掘是指挖掘基于时间或者其他序列的经例:给定9个数的序列,可以计算出它的3阶移动平常发生

8、的模式。序列模式的一个例子就是“一个9个月均及其权重为(1,4,1)的3阶加权移动平均,给中间一个前买了一台PC的顾客有可能在一个月内买一个新的权重大是为了减少平滑的影响。计算的结果可以按表1CPU”。由于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。