数据库新技术专题-论文

数据库新技术专题-论文

ID:15127836

大小:33.50 KB

页数:6页

时间:2018-08-01

数据库新技术专题-论文_第1页
数据库新技术专题-论文_第2页
数据库新技术专题-论文_第3页
数据库新技术专题-论文_第4页
数据库新技术专题-论文_第5页
资源描述:

《数据库新技术专题-论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据库新技术—数据挖掘软件09-2罗本华29号随着计算机技术迅猛发展,各种信息资源大量出现。同时,这种信息资源已经成为当今社会的重要财富。因此,随着需求要求,建立一个满足社会各个阶层、各个行业、各个部门的行之有效的信息系统成为当务之急。数据库技术随之产生。同时,数据库技术是一种非常重要的技术。数据库的建设规模、数据库信息量的大小和使用频度已成为衡量国家信息化程度的重要标志。而在现在,随着信息发展,数据库技术也得到了大量发展。而在数据库技术当中最具有代表性的技术就是数据挖掘技术。数据挖掘技术是信息技术自然进化与发展的结果。在各

2、个行业、各个领域都存在大量的信息资源存储,而这些信息资源可以被其他行业提取并引用,节省资源。这种数据挖掘技术引起了信息产业界的广泛关注。,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析、工程设计和科学探索等。随着计算机硬件以及计算机软件的的飞速发展,尤其是数据库应用的日益普及,人们面临数据快速扩张的海洋。如何在数据的海洋当中找到自己需要的数据,并且寻找数据不会耗费多的资源以及时间,同时要准确和迅速。同时有效地利用这些

3、数据海洋是信息技术工作者所关注的焦点。与日趋成熟的数据库管理技术和数据库软件工具相比较,人们所以的数据库分析技术的功能,却无法有效地为决策者提供有效地其决策所需要的知识。即造成“丰富的数据,贫乏的知识”。为了解决这一问题,自二十世纪八十年代开始,数据挖掘技术随之应运而生。数据挖掘技术的迅猛发展得益于目前全世界所拥有的巨大数据资源以及对这些数据资源转换为信息以及知识资源的巨大需求,对信息和知识的需求来自各行各业,如商业管理、生产控制、市场分析等。简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。该术语实际上有点用词不当。注意

4、,从矿石或砂子挖掘黄金称作黄金挖掘,而不是砂石挖掘。这样,数据挖掘应当更正确地命名为“从数据中挖掘知识”,不幸的是它有点长。“知识挖掘”是一个短术语,可能不能强调从大量数据中挖掘。毕竟,挖掘是一个很生动的术语,它抓住了从大量的、未加工的材料中发现少量金块这一过程的特点。这样,这种用词不当携带了“数据”和“挖掘”,成了流行的选择。还有一些术语,具有和数据挖掘类似,但稍有不同的含义,如数据库中知识挖掘、知识提取、数据/模式分析、数据考古和数据捕捞。数据挖掘也可以称为KDD,包括以下几个步骤:1.数据清理(消除噪音或不一致数据)2

5、.数据集成(多种数据源可以组合在一起)13.数据选择(从数据库中提取与分析任务相关的数据)4.数据变换(数据变换或统一成适合挖掘的形式;如,通过汇总或聚集操作)5.数据挖掘(基本步骤,使用智能方法提取数据模式)6.模式评估(根据某种兴趣度度量,识别提供知识的真正有趣的模式)7.知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。数据挖掘步骤可以与用户或知识库交互。有趣的模式提供给用户,或作为新的知识存放在知识库中。注意,根据这种观点,数据挖掘只是整个过程中的一步,尽管是最重要的一步,因为它发现隐藏的模式。我们同意数据

6、挖掘是知识发现过程的一个步骤。然而,在工业界、媒体和数据库研究界,“数据挖掘”比较长的术语“数据库中知识发现”更流行。因此,在本书中,我们选用术语数据挖掘。我们采用数据挖掘的广义观点:数据挖掘是从存放在数据库、数据仓库或其它信息库中的大量数据挖掘有趣知识的过程。基于这种观点,典型的数据挖掘系统具有以下主要成分:1.数据库、数据仓库、或其它信息库:这是一个或一组数据库、数据仓库、展开的表、或其它类型的信息库。可以在数据上进行数据清理和集成。2.数据库或数据仓库服务器:根据用户的数据挖掘请求,数据库或数据仓库服务器负责提取相数据

7、。3.知识库:这是领域知识,用于指导搜索,或评估结果模式的兴趣度。这种知识可能包括概念分层,用于将属性或属性值组织成不同的抽象层。用户确信方面的知识也可以包含在内。可以使用这种知识,根据非期望性评估模式的兴趣度。领域知识的其它例子有兴趣度限制或阈值和元数据(例如,描述来自多个异种数据源的数据)。4.数据挖掘引擎:这是数据挖掘系统基本的部分,由一组功能模块组成,用于特征、关联、分类、聚类分析、演变和偏差分析。5.模式评估模块:通常,该部分使用兴趣度度量(1.5节),并与挖掘模块交互,以便将搜索聚焦在有趣的模式上。它可能使用兴趣

8、度阈值过滤发现的模式。模式评估模块也可以与挖掘模块集成在一起,这依赖于所用的数据挖掘方法的实现。对于有效的数据挖掘,建议尽可能地将模式评估推进到挖掘过程之中,以便将搜索限制在有兴趣的模式上。6.图形用户界面:该模块在用户和挖掘系统之间通讯,允许用户与系统交互,指定数据挖掘查询或任务,提供信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。