基于大型数据库的数据挖掘应用研究

基于大型数据库的数据挖掘应用研究

ID:10598418

大小:50.50 KB

页数:0页

时间:2018-07-07

基于大型数据库的数据挖掘应用研究_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于大型数据库的数据挖掘应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于大型数据库的数据挖掘应用研究摘要:随着当前大数据时代的到来,在海量数据库的数据处理和数据分析过程中,应用有效的数据挖掘技术能够大大提升数据处理的速度,同时也能够提升数据处理的准确性。本文我们基于此主要来探究在大型数据库的处理过程中数据挖掘技术的相关应用,我们从大型数据库的数据挖掘概念入手,分析大型数据挖掘系统的概况以及当前比较经典的两类多数据挖掘技术。中国8/vie  关键词:大数据库;数据挖掘;多数据  中图分类号:TP311.13文献标识码:A:1007-9416(2017)01-0108-02  目前,数据挖掘技术融合了多项学

2、科内容,不仅包含数据库技术,而且也包含有人工智能以及统计学的相关内容,数据挖掘技术在当前大数据库的数据处理方面贡献了非常大的力量,数据挖掘系统在数据库的数据处理过程中作为一个独立模块而存在,有效的协调了不同模块之间的工作,下面我们首先来看一下大数据时代之下的数据挖掘信息概括。  1大数据时代下的数据挖掘相关内容概述  1.1数据挖掘技术的基本概念  数据挖掘技术主要就是指在数据库的信息处理过程中,通过特定的方式和特定的手段来进行数据信息的搜索。换句话说数据挖掘技术是基于当前大数据时代而存在的,在海量数据信息处理的过程中,数据挖掘技术能够

3、大大提升数据处理的效率。数据挖掘技术需要从当前海量数据库中不同形式,不同结构不同内容的数据通过特定方式搜寻出来,其中包含了大量不同领域的学科,通过数据挖掘技术我们能够做出归纳性的分析和总结,对于企业来说,数据挖掘技术能够有效的对市场进行预测和评估,同时也能够有效的根据客户的信息预测其未来的动向等。需要注意的是数据挖掘技术在实际的应用当中最重要的一门学科技术就是人工智能。  1.2数据挖掘的特点以及应用  数据挖掘技术主要有以下几个特点:  (1)数据挖掘的模型是非常复杂的,数据挖掘技术主要重视的就是数据库中信息的建模过程,通过对相关数据

4、关系进行有效的建模,把数学问题通过模型来表示出来从而有效地解决复杂的数据关系。(2)数据挖掘技术是基于当前大数据库而存在的,因此在处理数据信息上其基本的数据量是非常大的,数据挖掘主要就是从海量数据库中提出相关信息,海量数据库中的信息数据的格式结构以及内容都是具有一定差��的。总的来说,数据挖掘技术在具体实施的过程中需要有效的注意这几个方面的问题,从而保证数据挖掘的有效性和时效性。(3)数据挖掘技术跟随用户的实际需求出发,如果用户无法给出具体的要求,那么数据挖掘就会将用户所提出的有关信息进行提取,将用户所感兴趣的所有数据信息都进行反映,也

5、就是说数据挖掘的规则性并不是唯一的,而是随着用户要求的准确性而发生变化的。(4)数据挖掘最关键的一个特点是其不同的算法最优化是不同的,评判数据挖掘技术优劣的一个关键主要就是判断数据挖掘技术的有效性而不是最优性。  1.3数据挖掘任务探究  数据挖掘可以有以下几种不同的分类:  第一分类分析,即数据挖掘通过将一个特定的任务进行分类,通过用户所提出的具体要求,将某些特征数据信息反映到特定的类别上。分类分析的过程主要是建立一棵树,通过枝叶来向下进行逐级划分,将满足数据要求的类别进行下设,最终建立一棵树与规范要求的树。第二就是关联规则,在关联规

6、则中比较经典的方式有Apriori算法、Sampling算法等,关联规则主要是根据用户的这一信息数据来推算出其他方面的信息数据,比如说用户在数字化图书馆借阅书籍的过程中,关联规则可以根据用户在借阅书籍的种类以及根据用户的年龄、学历等信息来推算出用户的实际工作阶层,工作内容等,通过这种方式,企业可以有效发现潜在的市场等。第三是聚类分析,聚类分析主要是指在数据信息处理的过程中,将属于同一类别的数据信息存储到一个特定的数据库当中,聚类分析与数据信息的自身结构形式有关,它会根据系统所给定的相关性能指标来直接确定数据信息的类别,当前聚类分析比较经

7、典的算法有分解法、动态聚类法等。  2大型数据库的数据挖掘系统  前面我们对当前大数据库时代下的挖掘技术的相关概念以及分类进行了简单的分析和概述,下面我们主要来看一下挖掘技术中关联规则、聚类以及分类三种不同算法的相关内容。  2.1关联规则挖掘  关联规则挖掘前面我们已经简单的说明了其主要就是指针对数据信息的一个特定特征来推算出其他的数据信息,通过这种推算方式来发现数据信息中具有价值的内容。当前来看,关联规则挖掘中最为基本的算法就是Apriori算法,Apriori算法能够有效的根据用户信息的数据特征来推算出其他的数据特征,Aprior

8、i算法的基本运转原理是通过将海量数据库进行搜索之后,将数据库中的频繁集项进行搜索,然后根据所生成的频繁集项来建立一定的关联规则,最终实现有效的关联算法。在这一个具体的算法过程中,Apriori算法具有两个非

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。