欢迎来到天天文库
浏览记录
ID:27338970
大小:1.18 MB
页数:67页
时间:2018-12-02
《基于聚类模式的数据清洗技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于聚类模式的数据清洗技术广西师范大学硕士研究生论文基于聚类模式的数据清洗技术TowardsData-Mining:DataCleaningBasedonClusteringTechniques院系:数学与计算机科学学院年级:2000级专业:计算机软件与理论研究方向:现代数据库导师:张师超教授、严小卫教授研究生:唐懿芳完成时间:2003年4月1基于聚类模式的数据清洗技术TowardsData-Mining:DataCleaningBasedonClusteringTechniquesByTangyifangAthesisSubmittedinpar
2、tialsatisfactionof therequirementsforthedegreeofMasterofScienceAcademyofMathematicsandComputerScienceGuangxiNormalUniversityApril20032基于聚类模式的数据清洗技术目录摘要..................................................5ABSTRACT.................................................7目录...............
3、...................................3第一章绪论.............................................11.1引言........................................................11.2数据清洗研究的主要领域......................................21.2.1数据仓库中的数据清洗.....................................21.2.2知识发现过程中的数据清洗.....
4、............................41.2.3数据质量管理系统中的数据清洗.............................41.3数据清洗研究的现状..........................................41.3.1当前纠正数据错误的研究状况...............................41.3.2数据清洗中数据源整合的相关工作...........................61.4当前数据清洗方法存在的问题..............................
5、....61.5本文的研究内容及组织结构....................................71.5.1研究内容................................................71.5.2论文内容安排............................................8第二章数据清洗前的预处理...................................92.1引言.....................................................
6、...92.2清除脏数据和标准化简写......................................92.2.1清除脏数据.............................................102.2.2缩写标准化的处理.......................................122.3数据的转换.................................................132.4小结.............................................
7、..........14第三章基于聚类的多数据表记录匹配算法........................153基于聚类模式的数据清洗技术1.1引言.......................................................151.2键值的选取.................................................161.3记录的匹配算法.............................................171.2.1记录匹配的相关工作...............
8、.......................181.2.2所用的聚类技术........................
此文档下载收益归作者所有