物联网中的智能决策(PPT-31页)说课材料.ppt

物联网中的智能决策(PPT-31页)说课材料.ppt

ID:59711738

大小:963.00 KB

页数:32页

时间:2020-11-20

物联网中的智能决策(PPT-31页)说课材料.ppt_第1页
物联网中的智能决策(PPT-31页)说课材料.ppt_第2页
物联网中的智能决策(PPT-31页)说课材料.ppt_第3页
物联网中的智能决策(PPT-31页)说课材料.ppt_第4页
物联网中的智能决策(PPT-31页)说课材料.ppt_第5页
资源描述:

《物联网中的智能决策(PPT-31页)说课材料.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、物联网中的智能决策(PPT-31页)13.1数据挖掘概述13.2数据挖掘的基本类型和算法*13.3智能决策与物联网什么是数据挖掘?数据挖掘有哪三个步骤?本章内容13.1数据挖掘概述数据挖掘(DataMining)从大量数据中获取潜在有用的并且可以被人们理解的模式的过程。即从大量数据中提取或“挖掘”知识。是一个反复迭代的人机交互和处理的过程,历经多个步骤,并且在一些步骤中需要由用户提供决策数据挖掘的过程:数据预处理、数据挖掘和对挖掘结果的评估与表示每一个阶段的输出结果成为下一个阶段的输入沃尔马的故事13.1数据挖掘概述数据挖掘的过程数据预处理阶段数据准备:了解领域特

2、点,确定用户需求数据选取:从原始数据库中选取相关数据或样本数据预处理:检查数据的完整性及一致性,消除噪声等数据变换:通过投影或利用其他操作减少数据量数据挖掘阶段确定挖掘目标:确定要发现的知识类型选择算法:根据确定的目标选择合适的数据挖掘算法数据挖掘:运用所选算法,提取相关知识并以一定的方式表示知识评估与表示阶段模式评估:对在数据挖掘步骤中发现的模式(知识)进行评估知识表示:使用可视化和知识表示相关技术,呈现所挖掘的知识13.1数据挖掘概述数据挖掘的过程13.1数据挖掘概述13.2数据挖掘的基本类型和算法*13.3智能决策与物联网数据挖掘的基本类型和算法有那些?本章

3、内容13.2数据挖掘的基本类型和算法数据挖掘的基本类型关联分析(AssociationAnalysis)聚类分析(ClusteringAnalysis)离群点分析(OutlierAnalysis)分类与预测(ClassificationandPrediction)演化分析(EvolutionAnalysis)描述性挖掘任务:刻画数据库中数据的一般特性预测性挖掘任务:在当前数据上进行推断和预测关联分析关联分析的目标是从给定的数据中发现频繁出现的模式,即关联规则关联规则通常的表述形式是XY,表示“数据库中满足条件X的记录(元组)可能也满足条件Y”以某电器商场销售记录为

4、例:含义:4%(支持度)的顾客的年龄在20至29岁且月收入在3000至5000元,且这样的顾客中,65%(置信度)的人购买了笔记本电脑关联分析挖掘关联规则,需要置信度和支持度越高越好基本概念项集:满足若干条件的数据项的集合,如果条件数为k,则称k-项集满足年龄(顾客,“20~29”)的项集是1-项集满足年龄(顾客,“20~29”)收入(顾客,“3000~5000”)的项集是2-项集计算步骤首先找到具备足够支持度的项集,即频繁项集然后由频繁项集构成关联规则,并计算置信度分类和预测分类和预测的目标是找出描述和区分不同数据类或概念的模型或函数,以便能够使用模型预测数据类

5、或标记未知的对象所获得的分类模型可以采用多种形式加以描述输出分类规则判定树数学公式神经网络…分类与预测的区别:分类通常指预测数据对象属于哪一类,而当被预测的值是数值数据时,通常称为预测分类和预测以判定树方法为例,简要介绍分类的基本步骤和结果表示问题实例:假定商场需要向潜在的客户邮寄新产品资料和促销信息。客户数据库描述的客户属性包括姓名、年龄、收入、职业和信用记录。我们可以按是否会在商场购买计算机将客户分为两类,只将促销材料邮寄给那些会购买计算机的客户,从而降低成本。分类和预测用于预测客户是否可能购买计算机的判定树,其中每个非树叶节点表示一个属性上的测试,每个树叶节

6、点代表预测结果聚类分析聚类的目的是将数据对象划分为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大聚类与分类的区别:要划分的类是事先未知的聚类分析的应用聚类分析聚类分析的方法划分方法:要求事先给定聚类的数目k。首先创建一个初始划分,然后通过对划分中心点的反复迭代来改进划分。典型算法包括k-means算法和k-medoids算法等层次方法:对给定数据集合进行逐层递归的合并或者分裂,因此可以被分为合并或分裂方法。合并方法首先将每个对象都作为独立的类,然后持续合并相近的类,直到达到终止条件为止。分裂方法首先将所有的数据对象置于一个类中,然后反

7、复迭代并判定当前的类是否可以被继续分裂,直到达到终止条件为止基于密度的方法:只要某区域数据密度超过阈值,就将该区域的数据进行聚类。其优势在于噪音数据下的抗干扰能力,并能够发现任意形状的聚类聚类分析聚类分析的方法(续)基于网格的方法:把对象空间量化为具有规则形状的单元格,从而形成一个网格状结构。在聚类的时候,将每个单元格当作一条数据进行处理。优点是处理速度很快,因处理时间与数据对象数目无关,而只与量化空间中的单元格数目相关基于模型的方法:如果事先已知数据是根据潜在的概率分布生成的,基于模型的方法便可为每个聚类构建相关的数据模型,然后寻找数据对给定模型的最佳匹配。主要

8、分两类:统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。