数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择

数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择

ID:37342491

大小:419.91 KB

页数:46页

时间:2019-05-22

数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择_第1页
数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择_第2页
数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择_第3页
数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择_第4页
数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择_第5页
资源描述:

《数据仓库与数据挖掘技术(第二版)第09章数据挖掘语言与工具的选择》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据仓库与数据挖掘技术数据仓库与数据挖掘技术((第二版第二版))主编:夏火松第一章数据仓库与数据挖掘概述第二章数据仓库的分析第三章数据仓库的设计与实施第四章信息分析的基本技术第五章数据挖掘过程第六章数据挖掘基本算法第七章非结构化数据挖掘第八章离群数据挖掘第九章数据挖掘语言与工具的选择第十章知识管理与知识管理系统普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化面临问题:(1)各种数据挖掘问题及挖掘方法基于不同的模型和技术,彼此互相孤立,联系很少;(2)缺少简明精确的问题描述方法,挖掘的语义通常是由实现方

2、法决定的;(3)数据挖掘系统仅仅提供孤立的知识发现功能,难于嵌入大型应用;(4)数据挖掘引擎与数据库系统是松散耦合,T.Imielinski和H.Mannila称其为“文件挖掘(filemining)系统”,即它没有提供独立的应用操作语言。普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.1数据挖掘语言的分类类别特点功能代表数据挖掘查询语言数据挖掘原语五种原语DMQL数据挖掘建模语言基于XML的语言文档类型定义、通用模PMML式通用数据挖掘语言集成全面OLEDBforDM表9.1主要的数据挖掘语

3、言的分类普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.1数据挖掘语言的分类1.数据挖掘查询语言一个数据挖掘查询由以下五种基本的数据挖掘原语定义:(1)任务相关数据原语(2)被挖掘的知识的种类原语(3)背景知识原语(4)兴趣度测量原语(5)被发现模式的表示和可视化原语普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.1数据挖掘语言的分类2.数据挖掘建模语言数据挖掘建模语言是对数据挖掘模型进行描述和定义的语言PMML建模语言普通高等教育“十一五

4、”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.1数据挖掘语言的分类2.数据挖掘建模语言使用PMML进行模型定义由以下几部分组成:(1)头文件(aheader)(2)数据模式(adataschema)(3)数据挖掘模式(adataminingschema)(4)预言模型模式(apredictivemodelschema)(5)预言模型定义(definitionsforpredictivemodels)(6)全体模型定义(definitionsforensemblesofmodels)(7)选择和联合模型、全体模型

5、的规则(rulesforselectingandcombiningmodelsandensemblesofmodels)(8)异常处理的规则(rulesforexceptionhandling)普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.1数据挖掘语言的分类3.通用数据挖掘语言OLEDBforDataMining(DM)为了填补传统的数据挖掘技术和目前流行的关系数据库管理系统之间的空白,OLEDBforDM定义了重要的新的概念和特点,包括如下几点:1)数据挖掘模型(DataMiningMo

6、del,DMM)2)预言联接操作(PredicationJoinOperation)3)OLEDBforDM模式行集合(SchemaRowsets)普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.1数据挖掘语言及其标准化9.1.2分析与评价OLEDBforDM规范的发布在预言和描述分析模型被商业广泛应用使用的道路上是一个重大的里程碑。它同时具备了数据挖掘查询和建模语言的优点,它的推广必将推动数据挖掘行业的发展。但是,对于一些数据挖掘模型,比如:概念描述(特征和辨别规则)和关联规则,还有数据仓库模型,OLAP的创建和使用,在目

7、前的版本中仍然没有涉及。微软公司将继续积极地扩充和丰富它的内容。普通高等教育“十一五”国家级规划教材第九章数据挖掘语言与工具的选择9.2数据挖掘的研究热点研究焦点可能会集中到以下几个方面:õ发现语言的形式化描述,即研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化;õ寻求数据挖掘过程中的可视化方法,使知识发现的过程能够被用户所理解,也便于在知识发现的过程中进行人机交互;õ研究在网络环境下的数据挖掘技术(Webmining),特别是在因特网上建立DM服务器,并且与数据库服务器配合,实现Webmining;õ加强对各种非结构

8、化数据的开采(dataminingforaudio&video),如对文本数据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的开采

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。