8#9>.摘要当今,数值型数据在数据挖掘中被广泛应用,然而,许多分析是基于布尔类型数据的。所以,文章介"> 8#9>.摘要当今,数值型数据在数据挖掘中被广泛应用,然而,许多分析是基于布尔类型数据的。所以,文章介" />
数据挖掘中趋势模型的建立与分析.pdf

数据挖掘中趋势模型的建立与分析.pdf

ID:57638094

大小:153.76 KB

页数:3页

时间:2020-08-29

数据挖掘中趋势模型的建立与分析.pdf_第1页
数据挖掘中趋势模型的建立与分析.pdf_第2页
数据挖掘中趋势模型的建立与分析.pdf_第3页
资源描述:

《数据挖掘中趋势模型的建立与分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘中趋势模型的建立与分析于晨捷袁晓洁马涛(天津南开大学计算机科学与技术系,天津3"""4%)5,./16:789:;2<1;=;7>8#9>.摘要当今,数值型数据在数据挖掘中被广泛应用,然而,许多分析是基于布尔类型数据的。所以,文章介绍了一种新的模型去描述数值型数据,以便可以挖掘到隐藏的趋势信息。关键词数据序列数值型数据数据挖掘文章编号%""!,$33%,(!""!)"$,"%?$,"3文献标识码&中图分类号@A3%%!"#$%&’(%)#*+#,-#+./$)$"0%123"4252#%3",2.)#6+%+3)#)#*7’!12#8)27’+#9)+"8

2、)23+:+"(B;C/DE.;2E>FG>.C8E;DH91;29;/2I@;9:2>6>J7,K/2L/1M21N;DO1E7,@1/2<123"""4%)-;$%&+(%:K>P/I/7O,Q8/2E1E/E1N;N/68;O/D;P1I;678O;I12I/E/.1212J,:>P;N;D./27/2/67O1O.;E:>IO/D;R/O;I>2R>>6;/2N/68;O#@:1OC/C;D12ED>I89;O/2;P.>I;6E>I1O9D;E;Q8/2E1E/E1N;I/E/O>E:/E1E9/2.12;:1II;2ED;2I12F>DS./E1>2#

3、<2/="&,$:I/E/O;Q8;29;,Q8/2E1E/E1N;I/E/,I/E/.1212J%前言!模型的建立当今世界,数据每天都在迅猛地增长,如何有效地使用这这一模型主要是对数值型属性字段的数据进行处理,以变些数据却成为了一个问题,经常出现数据丰富而知识缺乏的现化趋势来取代原始数据,为清楚起见,进行如下定义:象。数据挖掘正是为解决这类问题而发展起来的一门技术,它定义%:规定"#$%%,%!,⋯,%&,⋯,%’,⋯(,"为所研究的数是将隐藏在大型数据库中原来未知的数据模式发掘出来。典型值型的数据按时间顺序排列的序列,其中%&为第&个元素的的理论有特征规则挖掘

4、、关联规则挖掘、分类规则挖掘、聚类规值。同样可以规定"!#$%!)*,%!)*+%,⋯,%!,⋯,%!+*,%,%!+*(,表示以第则挖掘、趋势分析、时间序列分析等。通过查阅大量文献资料可!个元素作为中心,与之相临的前*个元素和后*个元素组成发现,目前的数据挖掘技术偏重于发现数据库中不同离散化属的序列(后面的研究都是以这个序列作为出发点)。性值之间的关系,而对数值型属性之间变化趋势的相互影响分由上面的定义可以看出,上述操作将实际数值型的元素按析不够,因此无法发现类似下述这种知识,如:价格下降多少,照时间的顺序组织成了序列的形式。例如:在股票交易中,人们销售量才能上

5、升多少;某种股票换手率变化了某个值会导致股很关心股票每日的收盘价,所以可以将一支股票的收盘价按照票价格有什么变化等。采取以往的数据挖掘技术处理该问题时交易日的顺序组织成序列的形式"#$%%,%!,⋯,%&,⋯,%’,⋯(,非常牵强,通常做法是,对一些连续化的数值型数据进行聚类其中%&为第&个交易日的收盘价。同样在研究股票收盘价的时候也是应该有一个界限标定实际研究的范围,所以一般在原始操作,将之转化成布尔型的数据,再对之进行关联规则等经典数据挖掘的操作。而有些情况下,要考虑的数值型数据又有随的序列"上采用滑动窗口技术将之演化成若干个"!,这样为后面模型的描述奠定了基

6、础。时间成不均匀变化的情况,例如:在股票交易中,当分析股票之间的关系时,由于每一支股票都有自己的价格变化区间(股票定义!:规定*,-.!为以第!个元素为中心,在前*个元素&(包含%!)中出现的最大值;规定*,-/!为以第!个元素为中心,的价格可能一直在%"’!"元之间浮动,而股票(的价格可能在后*个元素(包含%!)中出现的最大值;规定*,01!为以第!在)"’*"元之间浮动),所以无法对所有的股票按照同样的情个元素为中心,在前*个元素(包含%!)中出现的最小值;规定况进行聚类操作。同样实际中人们真正关心的是股票的价格涨*,02!为以第!个元素为中心,在后*个元素(

7、包含%!)中出现了多少(一般用百分数表示),而不是当天的价格是多少,因此的最小值,即:研究数值属性上的变化趋势显得尤为重要,例如,在第!个交*,-.!-./0%&易数据和第!+%个交易数据已知的情况下,要根据这种变化的!)*!&!!趋势去预测第!+!个交易数据。基于上述考虑,笔者决定用一*,01!-.12%&!)*!&!!种新的模型去描述有关数值型数据的变化情况,该模型有效地*,-/!-./0%&!!&!&+*解决了上面遇到的问题,并为在数值型数据上进行关联规则挖*,02!-.12%&掘提供了很大的方便。!!&!!+*基金项目:教育部骨干教师资助计划基金资助作者简

8、介:于晨捷

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。