基于神经网络探析数据挖掘方法

基于神经网络探析数据挖掘方法

ID:23312090

大小:68.12 KB

页数:9页

时间:2018-11-06

基于神经网络探析数据挖掘方法_第1页
基于神经网络探析数据挖掘方法_第2页
基于神经网络探析数据挖掘方法_第3页
基于神经网络探析数据挖掘方法_第4页
基于神经网络探析数据挖掘方法_第5页
资源描述:

《基于神经网络探析数据挖掘方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于神经网络探析数据挖掘方法摘要:文章首先简要阐述了数据挖掘过程及常用的神经网络模型,并在此基础上对基于神经网络的数据挖掘方法进行探析。通过研究能够对促进神经网络技术在数据挖掘领域中的推广应用有所帮助。关键词:祌经网络;数据挖掘;算法1.数据挖掘过程及常用的神经网络模型1.1数据挖掘过程数据挖掘是一个由诸多步骤共同组成的具有反复特性的迭代过程,其最主要的目的是从海量的数据当中,找出人们最感兴趣的信息。大体上可将数据挖掘过程分为3个阶段,即数据准备、模式提取以及结果的解释与评估。(1)第一个阶段为准备所需的数据,具体可将这个阶段细

2、分为数据清洗、数据选取以及数据预处理和数据表示四个步骤。数据是数据挖掘过程中不可或缺的重要前提和基础,但大量的实践表明,只有数据是很难进行挖掘工作的,必须在对数据进行挖掘前,做一些相应的准确工作,这些工作也成为数据挖掘的重要环节。(1)第二阶段为模式提取。该阶段是数据挖掘的核心环节,需要先明确数据挖掘的任务及目标,并在正式确定目标之后,选择合适的算法或工具,开始对数据进行挖掘操作。在这个环节当中,算法是关键,即可选择单一的算法,也可多种方法联合使用,具体的选择应视挖掘的任务而定。(2)第三阶段为解释与评价。挖掘过程中发现的模式应

3、当以最容易理解的形式呈现给用户,其间要对发现的模式进行比较、校验,看是否与用户的要求相符,进而确定出挖掘效果。1.2神经网络模型现阶段,已知的人工神经网络模型有40多种,较为常用的有以下几种:(1)BP神经网络。BP是误差反向传播的简称,这种神经网络归属于前馈网络的范畴,其具有多层映射的特征,该网络所采用的主要学习方式为最小均差,结构简单、学习训练算法成熟、工作状态稳定是BP模型的3大特点,正因如此使得该模型获得了非常广泛的应用。由于BP算法对误差函数有着一定的要求,即误差函数必须可微,故此,为了有效克服局部极小的问题,多以全局

4、优化算法为主,如遗传算法等。(2)RBF神经网络。RBF是径向基函数的简称,该网络与BP网络在归属的范畴上相同,也属于前馈网络。RBF网络在激活函数方面有多种可选择,最常用的是高斯函数,因为这种函数具有很多显著的特点,如形式简单、径向对称、容易解析等等。由于RBF网络是一个多层前馈网络,故此只要隐单元足够多,便可达到任意给定精度,其在逼近目标时,采用的化整为零的思想,即将目标分解成为若干个局部对象。(1)混合型祌经网络。这是一种将其它方法有机融合到一起构成的神经网络模型,它与传统网络模型的拓扑结构相同,但学习机制却有所不同。常用

5、的混合型神经网络有模糊和进化2种。2.基于神经网络的数据挖掘方法2.1神经网络在数据挖掘中的应用优势神经网络是一门实用性较强的科学技术,其集多种现代技术于一身,有诸多并行分布的处理单元连接而成。从系统的角度上讲,神经网络归属于动态系统的范畴,具有自适应和非线性的特征,对噪声数据有着非常强的容错和承受能力。由于神经网络所具有的这些特点,使得基于神经网络构建的数据挖掘模型具备了与之相同的特点,这样便可以适应数据环境的不同变化,由此进一步提升了数据挖掘模型的准确性。可见,神经网络十分适用于数据挖掘领域。2.2基于神经网络的数据挖掘过程

6、由上文分析可知,在数据挖掘领域中,神经网络具有较高的适用性,以此为基础的数据挖掘过程分为以下几个阶段。2.2.1数据的选择及预处理阶段数据选择的主要目的是为神经网络的构建提供相应的数据支撑,这个过程可以细分为以下2个环节:(1)对数据进行训练,(2)对数据进行测试。观察和理解是选择数据时必须做的工作,当样本数据集确定之后,便可按照挖掘目标,并结合挖掘方法,对数据进行编码处理。2.2.2网络训练与剪枝当数据选择和处理工作完成之后,数据挖掘人员需要选用一个神经网络模型,同时确定相应的网络训练算法,通过该算法对神经网络进行训练。剪枝的

7、主要作用是以神经网络的准确性为前提,去除掉没有意义和价值的冗余结点由此会使网络模式更加简练,也更容易理解。2.2.3规则的提取与评估阶段经过以上2个阶段后,神经网络当中便会蕴含着学习到的规则,也就是常说的知识,但是此时的规则由于存在形式的原因,不容易理解,所以需要对规则进行提取。提取规则的主要目的在于将规则的形式转化为容易理解的形式,如模糊逻辑、决策树等,然后再借助测试样本对规则的可靠性进行测试、评估。2.3基于RBF神经网络的数据挖掘模型设计下面本文以RBF神经网络为依托,对数据挖掘模型进行设计,其整体框架结构如图1所示。整个

8、系统由以下模块构成:数据获取、数据处理、数据分类与评估、控制与干预、GUI人机交互、知识库。系统模块的设计情况如下。2.3.1数据准备①数据选择。在数据选择中,让用户利用数据访问接口对数据集进行自行选择,进一步确定数据集类型、数据集名称及数据集处所位置。数据访问

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。