资源描述:
《时序数据库中部分周期模式的挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、$""%年第!$期通信技术&’(!$)$""%总第!**期+’,,-./012/’.34506.’7’89&’(!**)4’21779时序数据库中部分周期模式的挖掘算法研究祝小莲!舒勤"(!中国电子科技集团公司第%"研究所,成都:!""*!)("四川大学电气信息学院,成都:!"":;)【摘要】时序数据库中关联规则或模式的出现通常会呈现一定的周期性,部分周期模式的挖掘是数据挖掘领域一个崭新的问题。首先介绍了部分周期模式的研究背景及相关概念,然后给出了现有的挖掘算法并对其进行分析比较,最后简述了在四川省智能交通系统中,应用部分周期模式的挖掘算法来分析交通流量及<+卡盈缺数量周期模
2、式的=>>系统。【关键词】数据挖掘算法时序数据库部分周期模式!"#"$%&’()*$%+,$-*"%,(.,&,+/0,),)1,)2,3"4"%,"#5$+$6$#"#!"!"#$%&’(%&)*"#+%)?!&’(%"<.32/2-25’@+A4+(+65.8B-:!""*!C?"+’77585’@A7502D/0/291.B<.@’D,12/’.A.8(E/06-1.F./G5D3/29)+65.8B-:!"":;C【76#+%$&+】<.2/,5H35D/53B121I135)133’0/12/’.D-7531.BJ1225D.336’KJ5D/’B/0/29122D
3、/I-2532’3’,55L25.B)1.B351D06@’DJ1D2/17J5D/’B/0J1225D.3/.2/,5H35D/53B121I1353/31./.25D532/.81.B.5KB121,/./.8JD’I75,(46/3J1J5D@/D32/.M2D’B-053265I10N8D’-.B31.B3’,5/.25DD57125BB5@/./2/’.31I’-2J1D2/17J5D/’B/0/29)265.8/G5335G5D17178’D/26,31.B1.179O53265,(P27132)265J1J5DD5J’D231J5D@’D,1.0532-B9’@
4、26535178’D/26,3/.265E/06-1.<.2577/85.24D1@@/0+’.2D’7E9325,1.BJ’/.23’-2265JD’31.B0’.3’@265,D53J502/G579(【8"/9(%.#】B121,/./.8178’D/26,3)2/,5H35D/53B121I135)J1D2/17J5D/’B/0/29!引言片,记作-W%Y。在时序数据库中,关联规则或模式的出现通常会呈现一定义$设.为基本特征集,无关属性全部用$号标记,定的周期性,即周期模式。周期模式可以应用于许多领域,例则部分周期模式挖掘中的模式/Z/!⋯/%⋯/0表示了集合?$.H
5、[#C:[$中的某个非空序列,其中/如:季节、潮汐和每日交通流量模式等。周期分析是指对周期%表示序列中第模式的挖掘,即在时序数据库中找出重复出现的模式。周期%个时间单位上的取值(可以为.中元素的非空子集也可以模式挖掘问题可分为:挖掘全周期模式、挖掘部分周期模式是$号)。如果某/%仅包含单个特征值则可以去掉其括号,例以及挖掘循环关联规则。全周期分析技术已在信号分析和统如:可以记[&为&。计中得到研究,但部分周期模式挖掘算法的研究还处于起步用1/1表示/的长度,即模式/的周期长度;用.2长度阶段。与全周期模式不同,部分周期模式只描述时间序列中表示/中取值为非$号的/%的个数
6、。一个.2长度为%的模某些点的周期特征而并非全部时间点,是相对松散的周期模式被称为%2模式。在模式/中,某个特征位上可能包含若干式,但是在现实世界中其存在更具普遍性。个可选特征值的并,即/%3/%!,/%$,⋯,/%4,此时该模式/记作/3/!⋯[/%!,/%$,⋯,/%4⋯/5。如果/3/!⋯/5和/63$问题描述/!]⋯/56拥有相同的周期长度,且在每一个时间单位%都有/%]-/%且/%6不全为$号,则称模式/6为模式/的子模式。一般说来,时序数据库中的任务相关属性都是时间连续定义%设%,!X,则-W%·1/^X!;,⋯,-W%·1/17值。为减小待挖掘的数据量,需将原
7、数据集中任务相关属性1/^Y称为一个周期段。如果模式/3/!⋯/8⋯/5的任意/8为进行时间上的分割。$或其全部特征值都在周期段-W%·1/^X!;,⋯,-W%·定义!假设时间单位,已知(由用户给定),则记第%个1/^X1/^;的第8个位置上出现,则称/在该周期段上为真或命中。时间单位为,%,即,%对应于时间区间W%·,,?%X!C·,),其定义*对于某个模式/,设,为时间片数据库序列-中%+"。设任务相关数据库-是数据库事务的集合,则称在W!Y,⋯,-W)Y按周期长度1/^所划分的最大周期个数,即,第