欢迎来到天天文库
浏览记录
ID:8405856
大小:496.50 KB
页数:52页
时间:2018-03-20
《基于数据仓库的多策略通用数据采掘工具MSMiner》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、高级人工智能第十三章知识发现(二)史忠植中国科学院计算技术所2021/8/61史忠植高级人工智能主要内容研究背景MSMiner体系结构元数据数据仓库平台数据采掘集成工具2021/8/62史忠植高级人工智能典型的知识发现系统SAS公司的SASEnterpriseMinerIBM公司的IntelligentMinerSolution公司的Clementine加拿大SimonFraserUniv.的DBMiner中科院计算技术研究所的MSMiner等2021/8/63史忠植高级人工智能知识发现工具SAS
2、SAS公司的SASEnterpriseMiner是一种通用的数据挖掘工具。通过收集分析各种统计资料和客户购买模式,SASEnterpriseMiner可以帮助您发现业务的趋势,解释已知的事实,预测未来的结果,并识别出完成任务所需的关键因素,以实现增加收入、降低成本。2021/8/64史忠植高级人工智能知识发现工具SASSASEnterpriseMiner提供"抽样-探索-转换-建模-评估"(SEMMA)的处理流程。数据挖掘算法有:·聚类分析,SOM/KOHONEN神经网络分类算法·关联模式/序列模
3、式分析·多元回归模型·决策树模型(C45,CHAID,CART)·神经网络模型(MLP,RBF)·SAS/STAT,SAS/ETS等模块提供的统计分析模型和时间序列分析模型也可嵌入其中。2021/8/65史忠植高级人工智能知识发现工具IntelligentMinerIBM公司的IntelligentMiner具有典型数据集自动生成、关联发现、序列规律发现、概念性分类和可视化显示等功能。它可以自动实现数据选择、数据转换、数据发掘和结果显示。若有必要,对结果数据集还可以重复这一过程,直至得到满意结果为
4、止。2021/8/66史忠植高级人工智能知识发现工具ClementineSolution公司的Clementine提供了一个可视化的快速建立模型的环境。它由数据获取(DataAccess)、探查(Investigate)、整理(Manipulation)、建模(Modeling)和报告(Reporting)等部分组成。都使用一些有效、易用的按钮表示,用户只需用鼠标将这些组件连接起来建立一个数据流,可视化的界面使得数据挖掘更加直观交互,从而可以将用户的商业知识在每一步中更好的利用。2021/8/67
5、史忠植高级人工智能数据挖掘工具:公用系统MLC++MatlabWeka2021/8/68史忠植高级人工智能知识发现工具MSMiner中科院计算技术研究所智能信息处理开放实验室开发的MSMiner是一种多策略知识发现平台,能够提供快捷有效的数据挖掘解决方案,提供多种知识发现方法。MSMiner具有下列特点:.基于数据仓库和新型的元数据管理按照主题创建数据仓库,并通过元数据进行管理和维护。.数据的抽取、转换、装载等预处理方便,支持OLAP查询。2021/8/69史忠植高级人工智能MSMiner的特点提
6、供决策树、支持向量机、粗糙集、模糊聚类、基于范例推理、统计方法、神经计算等多种数据挖掘算法,支持特征抽取、分类、聚类、预测、关联规则发现、统计分析等数据挖掘功能,并支持高层次的决策分析功能。实现了可视化的任务编辑环境,以及功能强大的任务处理引擎,能够快捷有效地实现各种数据转换和数据挖掘任务。可扩展性好。转换规则和挖掘算法是封装的、模块化的,系统提供了一个开放的、灵活通用的接口,使用户能够加入新的规则和算法。容易进行二次开发。2021/8/610史忠植高级人工智能数据仓库:特征面向主题集成性稳定性随
7、时间变化2021/8/611史忠植高级人工智能数据仓库:OLAPROLAP:RelationalOLAPMOLAP:MultidimensionalOLAPHOLAP:HybridOLAP2021/8/612史忠植高级人工智能数据挖掘和数据仓库的结合数据仓库为数据挖掘提供经良好处理的数据源数据挖掘为数据仓库提供深层数据分析手段2021/8/613史忠植高级人工智能MSMiner体系结构设计目标:提供快捷有效的数据挖掘解决方案。设计要求:开放性可扩展性效率易用性2021/8/614史忠植高级人工智能
8、MSMiner体系结构MSMiner体系结构示意图客户端服务器端元数据模块执行数据采掘任务编辑数据采掘任务数据采掘集成工具数据抽取和集成主题组织OLAP可视化数据仓库管理器数据仓库OLEDBforODBC2021/8/615史忠植高级人工智能元数据的内容关于外部数据源的关于内部数据的(包括数据库、表、字段的信息)关于数据仓库的(包括事实表、维表、立方以及其它的中间表)关于用户信息的数据采掘算法(包括算法的参数信息)关于采掘任务的(包括采掘步骤、每个步骤的所用的参数)2021/8/6
此文档下载收益归作者所有