知识发现课程实践介绍(ppt)

知识发现课程实践介绍(ppt)

ID:24948499

大小:583.00 KB

页数:20页

时间:2018-11-16

知识发现课程实践介绍(ppt)_第1页
知识发现课程实践介绍(ppt)_第2页
知识发现课程实践介绍(ppt)_第3页
知识发现课程实践介绍(ppt)_第4页
知识发现课程实践介绍(ppt)_第5页
资源描述:

《知识发现课程实践介绍(ppt)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、MSMiner课程项目介绍史忠植陈明智能科学课题组中科院计算所智能信息处理重点实验室多策略数据挖掘平台软件MSMinerMSMiner(Multi-StrategiesDataMiner)是一个针对决策支持的以数据仓库为基础的通用数据挖掘平台软件,同时提供了一个轻量级的数据仓库解决方案。MSMiner是什么?数据仓库的设计、建模第三方工具如PowerDeginer数据转换与集成MSETL数据存储与管理 第三方工具如Oracle,SQLServer等数据分析和展现MSOLAP采用第三方查询、报表工具。数据仓库的维护和管理MSMetaData一个数据仓库解决方案主要包括:统计分析或

2、数据挖掘工具MSDM背景介绍MSMiner由中科院计算所智能信息处理重点实验室从1999年开始设计和实现,经历了早期的VB版本,后来又用VC重新实现,目前正在开发3.0版本。MSMiner体系架构MSMiner体系结构外部事务型数据库数据仓库元数据管理数据抽取、转换、装载(ExtractTransformLoad)主题2主题1主题nOLAP及可视化工具数据挖掘模块...MSMiner的数据仓库以功能强大的元数据管理MetaServer为调度中心数据仓库管理工具MSMetaDataETL(数据抽取、装载、转换)工具MSETLOLAP(联机分析处理)工具MSOLAP数据挖掘(Dat

3、aMining)工具MSDMMSMiner功能特点MSMiner的若干特点:1)通过ODBC接口将数据存储在第三方关系数据库(如Oracle、Sybase、SQLServer、Informix和IBMDB2等),支持多种不同的数据源;2)采用DLL形式封装数据挖掘算法,从而可以灵活扩充,这样就提供了丰富的挖掘策略。3)以对话框向导引导用户建立ETL和数据挖掘任务,以面向对象的方式来组织和执行ETL和数据挖掘任务4)在挖掘任务执行引擎中,提供了任务调度功能,可以定时定期地执行挖掘任务,同时采用多线程技术并发地执行挖掘任务和任务中的步骤。MSMiner启动时欢迎界面MSMiner登

4、录界面——MSMiner控制台MSMiner数据仓库管理子系统MSMetaDataMSMinerETL子系统MSETLMSMiner联机分析处理子系统MSOLAPMSMiner数据挖掘子系统MSDM课程项目内容要求对MSMiner数据挖掘子系统进行扩展开发,选择实现下列某种算法:1.聚类算法:k-means、k-harmonic2.分类算法:C4.5、SVM、GA3.关联规则:Apriori、FP-tree4.神经网络提交要求和项目流程提交要求和项目流程如下:1)可以两至三人为一小组工程实现;2)实现结果为符合MSMiner数据挖掘子系统挖掘算法DLL接口规范要求的DLL文件。

5、3)开发完毕,在机房MSMiner环境下进行测试。4)最后提交程序源码和实验报告,在实验报告中要写清算法步骤、说明以及心得体会等,源码要求有清晰明确的注释。课程项目预备知识以下为完成此项目的预备知识:深刻掌握一种或几种数据挖掘算法,如聚类、分类、关联规则、神经网络算法等,能够用C/C++编程实现。熟悉VC++6.0IDE编程环境,掌握MFC编程机制及其用法。了解组件编程技术,能够开发简单的DLL程序。数据库基础知识、熟悉SQL语句。课程项目提供的资源可供参考的资源:1)MSMiner数据挖掘子系统挖掘算法DLL的接口详细说明2)两个算法DLL开发示例(BP算法、SOM算法)3)

6、算法DLL公共代码框架(一组工程文件,工程名为AssocALG)4)训练数据与测试数据5)书:史忠植著.知识发现.清华大学出版社.2002.P295~326,可帮助了解MSMiner体系设计、编程架构等背景知识。常见问题解答几个常见问题的说明:1)Q:为什么要实现DLL程序,可以实现成可执行程序吗?A:因为本次实验要开发算法DLL程序,目的正是用于封装数据挖掘算法,并最终由MSMiner数据挖掘子系统所调用。所以不能实现成可执行程序。2)Q:算法DLL接口规范是否很复杂,难以在短时期内实现?A:我们已经提供了算法DLL接口规范文档,接口函数只有四个,其中只有两个要自己实现,其余

7、两个可直接使用示例代码。开发人员要做的就是将算法功能实现和封装,使得可以通过两个接口函数MSMiner就能所用该算法的功能。3)Q:我注意到接口规范中提供算法DLL的公用函数类CPublicFunc,它有什么用?DLL算法程序1MSMiner数据挖掘子系统MSDMDLL算法程序2DLL算法程序3DLL算法程序n元数据管理MetaServer........在每个算法的具体实现中,不可避免的要实现数据的输入输出及相关参数的存储。而在整个MSMiner平台中,数据的输入输出等由元数据管理模块统一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。