数据挖掘的知识类型.ppt

数据挖掘的知识类型.ppt

ID:56373765

大小:393.00 KB

页数:23页

时间:2020-06-14

数据挖掘的知识类型.ppt_第1页
数据挖掘的知识类型.ppt_第2页
数据挖掘的知识类型.ppt_第3页
数据挖掘的知识类型.ppt_第4页
数据挖掘的知识类型.ppt_第5页
资源描述:

《数据挖掘的知识类型.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、双击添加主标题概念/类描述关联模式分类聚类分析预测时间序列偏差检测1概念/类描述就是通过对某类对象关联数据的汇总、分析和比较,用汇总的、简洁的、精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述。特征性描述是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征。生成一个类的特征性描述只涉及该类对象中所有对象的共性。区别性描述描述两个或更多个不同类对象之间的差异。生成区别性描述则涉及目标类和对比类中对象的共性。2.1概念/类描述2.1概念/类描述数据特征的输出可以用多种形式提供。包括饼图、条图、曲线、多维数据方和包括交叉表在内的多维表。结果描

2、述也可以用泛化关系或规则(称作特征规则)形式提供。例如:利用面向属性的归纳方法(AOI),在一个商场数据库(2000销售)中进行属性归纳操作,获得了如下的归纳结果:表2-1AOI方法挖掘结果表格表示示意描述地点商品销售额(百万)个数累计(千)亚洲欧洲北美亚洲欧洲北美电视电视电视电脑电脑电脑1512281201502003002504501000120018002.1概念/类描述对于以上结果,也可以用组合表(crosstab)或其他图表的形式来加以描述。数据分析中可视化图示非常普遍。表2-2对应表2-1的组合表表示描述图2-1对应表2-2棒图表示描述TVComputerTV+Computers

3、alescountsalescountsalescountAsia1530012010001351300Europe1225015012001621450North_Amaerica2845020018002282250All_region45100047040005255000itemLocation2.1概念/类描述图2-2对应表2-1(部分数据)的饼图表示描述北美51%亚洲27%欧洲22%电视销售图2.1概念/类描述区别性描述是将目标类对象的一般特性与一个或多个对比类对象的一般特性比较。这种比较必须是在具备可比性的两个或多个类之间进行。例如,对某校讲师和副教授的特征进行比较,可能会得到

4、这样一条规则:“讲师:(78%)(paper<3)and(teachingcourse<2)”,而“副教授:(66%)(paper>=3)and(teachingcourse>=2)”;该对比规则表示该校讲师中约有四分至三的人发表论文少于三篇且主讲课程不超过一门;而对比之下该校副教授中约有三分至二的人发表论文不少于三篇且主讲课程不少于一门。2.2关联模式关联模式挖掘旨在从大量的数据当中发现特征之间或数据之间的相互依赖关系。这种存在于给定数据集中的频繁出现的关联模式,又称为关联规则。关联可分为简单关联、时序关联、因果关联等。这些关联并不总是事先知道,而是通过数据库中数据的关联分析获得的,其对商

5、业决策具有重要价值。因而关联分析广泛用于市场营销、事务分析等应用领域。挖掘关联知识的一个典型应用实例就是市场购物分析。根据被放到一个购物袋的(购物)内容记录数据而发现的不同(被购买)商品之间所存在的关联知识无疑将会帮助商家分析顾客的购买习惯。发现常在一起被购买的商品(关联知识)将帮助商家指定有针对性的市场策略。比如:顾客在购买牛奶时,是否也可能同时购买面包或会购买哪个牌子的面包,显然能够回答这些问题的有关信息肯定回有效地帮助商家进行有针对性的促销,以及进行合适的货架商品摆放。如可以将牛奶和面包放在相近的地方或许会促进这两个商品的销售。2.2关联模式根据关联规则所涉及变量的多少,可以分为多维关

6、联规则和单维关联规则。通常,关联规则具有:XY的形式,即”A1...AmB1...Bn”的规则;其中,Ai(i{1,...,m}),Bj(j{1,...,n})是属性-值对。关联规则XY解释为“满足X中条件的数据库元组多半也满足Y中条件”。例如:一个数据挖掘系统可以从一个商场的销售(交易事务处理)记录数据中,挖掘出如下所示的关联规则:age(X,”20-29”)∧income(X,”20K-30K”)buys(X,”mp3”)[support=2%,confidence=60%]上述关联规则表示:该商场有的顾客年龄在20岁到29岁且收入在2万到3万之间,这群顾客中有60%

7、的人购买了MP3,或者说这群顾客购买MP3的概率为六成。这一规则涉及到年龄、收入和购买三个变量(即三维),可称为多维关联规则。2.2关联模式对于一个商场经理,或许更想知道哪些商品是常被一起购买,描述这种情况的一条关联规则可能是:Contains(X,”computer”)contain(X,”software”)[support=1%,confidence=60%]上述关联规则表示:该商场1%销售交易事物记

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。