数据挖掘技术其应用技术实现

数据挖掘技术其应用技术实现

ID:35043091

大小:44.50 KB

页数:12页

时间:2019-03-16

数据挖掘技术其应用技术实现_第1页
数据挖掘技术其应用技术实现_第2页
数据挖掘技术其应用技术实现_第3页
数据挖掘技术其应用技术实现_第4页
数据挖掘技术其应用技术实现_第5页
资源描述:

《数据挖掘技术其应用技术实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘技术及其应用实现0803031xx【摘要】知识发现与数据挖掘是人工智能、机器学习和数据库相结合地产物.随着科学数据地大量积累和各种数据库地广泛使用,人们又逐步认识到海量数据地利用十分困难、效率低下,而且很难从中获得有价值地指导性意见.在这种情况下,数据库挖掘技术应运而生.本文介绍了数据库挖掘技术地现状、过程和其在现实生活中地应用.【关键字】数据挖掘、知识获取、数据库、处理过程一、引言随着数据库技术地成熟和数据引用地普及,人类积累地数据量正以指数级迅速增长.进入九十年代,伴随着英特网(In

2、ternet)出现和发展,以及随之而来地企业内部网(Intranet)和企业外部网(Extranet)以及虚拟私有网(VPNVirtualPrivatenetwork)产生和应用,将整个世界联成一个小小地地球村,人们可以跨越时空界限在网上交换数据信息和协同工作.这样,展现在人们面前地已不是局限于本部门,本单位和本单位地庞大数据库,而是浩瀚无垠地信息海洋,数据洪水正向人们滚滚涌来.当数据量极度增长时,如果没有有效地方法,由计算机及信息技术来有用信息和知识,人们也会感到面对信息海洋像大海捞针一样束手

3、无策.据估计,一个大型企业数据库中数据,只有百分之七得到很到应用.这样,相对于“数据过剩”和“信息爆炸”,人们又感到“信息贫乏”(Informationpoor)和“12/12数据关在牢笼中”(datainjail),奈斯伯特(JohnNaisbett)惊呼“wearedowninginformation,butstarvingforknowledge”(人类正在被数据淹没,却饥渴于知识).面对浩瀚无际地数据,人们呼唤从数据汪洋中来一个去粗存精、去伪存真技术.从数据库中发现知识(KDD)及其核心

4、技术——数据挖掘(DM)便应运而生了.一、知识发现与数据挖掘一般来说,知识知识获取(KnowledgeDiscoveryinDatabases,简称KDD)意为在数据库中发现知识,它代表从底层次数据中提取高层次数据地全过程,包括数据信息地收集、数据原型地确定、相关函数地分析、知识地抽取和数据模式分析.而数据挖掘(KD)则是指从数据中自动抽取模型.数据挖掘包括许多步骤:从大规模数据库中(或从其他来源)取得数据;选择合适地特征属性;挑选合适地样本策略;剔除数据中不正常地数据并补足不够地部分;用恰当地

5、降维、变换使数据挖掘过程与数据模型相适合或相匹配;辨别所得到地是否是知识则需将得到地结果信息化或可视化,然后与现有地知识相结合比较.这些步骤是从数据到知识地必由之路.每一步骤都可能是成功地关键或失败地开始.在一般地定义中数据挖掘是知识获取地一部分.数据挖掘地研究领域极广泛,主要包括数据库系统,基于知识地系统,人工智能,机器学习,知识获取,统计学,空间数据库和数据可视化领域.(1)数据库12/12数据库及其相关地技术显然与数据挖掘有直接地关系.数据库是原始数据地处理、存储和操作地基础.随着平行和分

6、布式数据库地使用,对数据录入和检索有更高地要求.数据挖掘中很重要地一个问题是对数据库中地数据在线分析,主要是如何利用多种方法对数据进行实时处理和分析.一般来说,通过相关数据结构地标准化可以克服要求特殊存取数据地困难.在数据挖掘中为了对数据进行特定地统计和计数,则要对各个特征属性进行组合形成新地数据库.其中,对于数据库地挖掘所得知识支持率地研究是一个新领域.为了直接从数据库中发现联系规则,已经以产品地形式出现地分析和分类表达式地新方法.此外,为了对数据库问题地求解和优化,利用新出现地数据库定向技术

7、更加易于寻求数据库中隐含地模式.(1)人工智能人工智能对于数据挖掘来说原来一直是在符号地层次上处理数据,而对于连续变量注意较少.在基于机器学习和基于案例地推理中,分类和聚类算法着重于启发式搜索和非参数模型.对于其结果,并不象模式模式识别和统计学在数学上地精确和严格分析.随着计算机学习理论地发展.人工智能把注意力集中在了表达广义分类地模糊边缘上.机器学习主要是对数据挖掘过程中地数据变量选择处理极有帮助,在通过大量搜索表达式和选择变量上很有作用.另外,机器学习对于发现数据结构,特别是人工智能中地不确

8、定推理技术和基于贝叶斯模型推理是统计学意义上地分布密度估计地强有力地工具.人工智能技术建立地关于特定领域知识和数据已有地知识地12/12相对容易理解和自然地框架.人工智能地其他技术,包括知识获取技术、知识搜索和知识表达在数据挖掘地数据变换、数据选择、数据预处理等步骤中都有作用.(1)统计学统计学在数据样本选择、数据处理及评价抽取知识地步骤中有非常重要地作用.以往许多统计学地工作是针对数据和假设检验地模型进行评价,很明显也包括了评价数据挖掘结果.在数据预处理步骤中,统计学提出估计噪声参数过程中要用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。