欢迎来到天天文库
浏览记录
ID:45756649
大小:2.63 MB
页数:121页
时间:2019-11-17
《KDD及其集成应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、中国科学技术大学博士学位论文KDD及其集成应用研究姓名:白石磊申请学位级别:博士专业:模式识别与智能系统指导教师:熊范纶瓯®凰敷氓竝nh&e炉湖©血tjhh昶豳d耳國有範殂ions中同科学技术大学博士学位论文摘gKnowledgedisintel1igentsc0mp1eXtaskSa主eng•1neer•1ngandart•1f•1c•1a1inte1asystemat•1ca1study0nt11istoP•1c■ThesummaryontfirSt.Anddaovery计算机和信息技术类社会的三大要素(能羽力。如今世界己经进入】接结果,C它的基础疑知谖中国科学
2、技术大学博士学位论文第一章1.2KDD的产生及发展随着计算机、通信和数扌的方式获取和存储数据,这戈世纪80年代,全球信息量4世界所拥有的数据库及其所彳每天要产生100MB以上于一一个典型数据库每天要接・能称之为种发现策略和技术的集成的专题会议也把数据挖掘从国际KDD学术g现方法;知识发现过程中掘与数据仓库;复杂数据衣等)的知识发现;文本矢互式、在线式知识发现系多我国在知识发现方面召开征第4屈全国裤I瞬域使用较多,在工程应用领中国科学技术夫学博士学位论文第一章非平凡,,是指在KDD由度。对于能够以确定的计I总工资或平均工资等,称为、"过程(Proces节,涉及数据预处
3、理、模式扌式提取步骤往往需要经过多Z化,不断提高挖掘效率。“有效性(Valid是成數勰翹魏询的鑫敢惟盗彳不确定性、结构性、稀疏用价值的信息进行非平〉程,感兴趣的知识或高层进行研究。简单地说,KDD菊得有用的知识,这就决定得知识的封闭过程,而是通常包括如下基本过程:从挖翹I圖辭蒯嚴1.4KDD的分类数据挖掘的分类从不同J类标准:挖掘对象、挖掘任7(1)根据挖掘对象3不同的数据库在数据的?数据库、面向对象数据库、库、异质数据库、遗产数扼对象的諏j膜型从数据中获中国科学技术大学博士学位论文第识挖掘系统。1.5KDD的主要知I利用数据挖掘技术万识类型如下。概念描述(Con(
4、聚类分析(C1ust成的蟀Iwb蝕类分部对象之间相似度最大,而同之处在于:获取分类模型ata),r扈扌看竅怖监督学习方法;类别归属标志在聚类分析处数据挖掘对聚类分析的要求形状的能力、处理噪声的能力怫我生要分対?莉勢旁法Q由。1・6KDD的主要技习知识发现是一交叉学统计学、机器学习、智能不同或者应用领域的不同容丰富、方法众多。本节价1・6・1统计学才RST■Jr>的核刻划中国科学技术大学博十学位论文第一章绪说1・6.2机器学习方一些机器学习方法理所交易、医疗记录等此类信息据挖掘这两个概念在一定程立能够根据经验自我提咼处J妨认为机器学习是研究通过£比,它不强调需要有大规
5、模I鹽泗瞬讎靈酬躺ri虧不完整等各种不完备信息,的核心概念是不可区分扌糙集方法是通过等价类J息表中导出分类/决策规贝相同信息分布的子表,不4简单、易于理解。粗糙集彳用RoughSet的完整库中发现分类规则的基环鵜擴瞿糙藕御询ill神经网络方法:神经网络作为模拟复杂的拓扑结构、学习规则以及,有:前向网络(BP)、Ho网络(REF)等【JLc9由于神经网络非常适件问题时不需要了解网络内部丿发现屮,并以不同的网络模2反映了在论域中可被模糊中国科学技术大学博【学位论文第一芳模糊集理论:该理说系统的复杂性越高,精确神经网络、遗传算法等)表达形式是模糊IF—的实用价值。所谓给定
6、了论域u_t数〃。(“)e[0,1]云模型方法:云模芒銘的b],法与Apriori算法结规则,初步显示云模型的有安web目志挖掘[YCZ0]人工免疫系统:人体免通过高度复杂的网络结构来过程中所具有的识别能力、与有重要的工程应用价值。1$[Ac951o虽然目前还处二中国科学技术大学博L学位论义第并同时开发了一种可视化无化过程的可视化;以及一彳蚁群算法:蚁群算咅七初由意大利学者A.colomi、卜的注意【cDM911,菠甫于TsP问题求解【由fKwO21、分配问题[co1omi,取得了一系列较好的实验和总Ant.Miner,1身很多问题还缺乏严格郎中国科学技术大学博士学
7、位论文第一章绪说智能计算:神经网络遗传算法模糊集等数扌中国科学技术夫学博卜学位论文第一苒关联规则的挖掘需要在大的。通常采用逐步求精的较大的数据集进行一次挖改进挖掘质量。空间聚类:空间聚?簇或稠密区域。由于通常类算法基本上都可以用于竺1.7.2Web数据挖扼一些结中国科学技术大学博十学位论文第一章户的访问模式。分析这种数扌偏好、web广告策略从而1大部分w曲分析工具提供分彳具和模式分析工具两种。模I信息理论等技术从客户的访I可视化和解释所发现的客户1。7・3复杂数据多杂结灘酸潮1僦匡零、W中国科学技术大学博十学位论文第-构化的字段,也包含大量无:索、文档关联分析、
此文档下载收益归作者所有