数据挖掘中的数据预处理

数据挖掘中的数据预处理

ID:5278460

大小:1.02 MB

页数:71页

时间:2017-12-07

数据挖掘中的数据预处理_第1页
数据挖掘中的数据预处理_第2页
数据挖掘中的数据预处理_第3页
数据挖掘中的数据预处理_第4页
数据挖掘中的数据预处理_第5页
资源描述:

《数据挖掘中的数据预处理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、内容提要随着社会的发展和数据库的应用,各领域的应用数据库中都积累了大量的历史数据。如何利用这些有潜在价值的数据,从中提取出有用的信息和知识,是应用者日益关注的问题,也是数据挖掘技术的关键所在。要进行数据挖掘,首先要保证数据质量,良好的数据能提高数据挖掘效果和效率,数据预处理逐渐成为数据挖掘不可缺少的重要前提。在数据挖掘的过程中如果只着眼于数据挖掘算法的探讨,而忽视了对数据预处理的研究,在一定程度上往往会失去数据挖掘的某些重要意义。因为实际系统中的数据一般都具有不完整性、冗余性和模糊性,很少能直接满足数据挖掘算法的要求。另外,海量的数据中无意义的成分

2、很多,严重影响了数据挖掘算法的执行效率,而且由于其中的噪音干扰还会造成挖掘结果的偏差。因此,对不理想的原始数据进行有效的归纳和预处理,已经成为数据挖掘系统实现过程中的关键问题。本文通过对数据挖掘、数据预处理技术和理论的学习,以及对国内外数据挖掘与数据预处理系统的发展情况的研究,归纳总结了国内、外数据挖掘系统中数据预处理的特点,根据当今数据挖掘技术和数据挖掘系统的发展趋势,设计了一个数据预处理系统,该软件设计实现的预处理系统主要包括数据预处理过程中最常用、最直接、最有效的和有一定通用价值的维规约、聚集、过滤异常值、去掉重复记录处理,软件在一定程度上实

3、现了对大量数据的清洗工作,为进一步数据挖掘提供了可靠的数据保障。关键词:数据挖掘数据预处理维规约聚集过滤异常值重复记录处理目录内容提要第一章绪论.........................................................................................................11.1引言..............................................................................................

4、.....................11.2数据挖掘(DATAMINING).............................................................................11.3数据挖掘与知识发现简介...............................................................................21.4数据挖掘系统简介.....................................................

5、......................................61.5本文的主要内容.............................................................................................12第二章国内外数据挖掘系统介绍.......................................................................132.1国外数据挖掘系统...................................

6、......................................................132.2国内数据挖掘系统.........................................................................................152.3国内数据挖掘系统的发展环境及趋势.........................................................172.4本章小结..................................

7、.......................................................................20第三章数据预处理简介.......................................................................................213.1数据预处理.................................................................................................

8、....213.2数据清洗(DATACLEANSING).................................

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。