关联规则算法分析与其在铁路隧道安全管理中的应用

关联规则算法分析与其在铁路隧道安全管理中的应用

ID:32130638

大小:2.06 MB

页数:73页

时间:2019-01-31

关联规则算法分析与其在铁路隧道安全管理中的应用_第1页
关联规则算法分析与其在铁路隧道安全管理中的应用_第2页
关联规则算法分析与其在铁路隧道安全管理中的应用_第3页
关联规则算法分析与其在铁路隧道安全管理中的应用_第4页
关联规则算法分析与其在铁路隧道安全管理中的应用_第5页
资源描述:

《关联规则算法分析与其在铁路隧道安全管理中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、的数据作一些简单的查询及统计工作,而并没有挖掘出这些数据中潜藏的病害规律。铁路部门每年都投入大量的人力、物力和资金用于隧道病害的维修和整治,但隧道的状况仍然没有根本好转。因此,需要通过系统的分析,总结铁路隧道的病害特点[21,及通过大量隧道缺陷数据来找到这些存在于铁路隧道中的病害数据之间隐藏着的一些微妙的关系,为铁路隧道的日常维护、病害检测、病害整治提供强有力的决策支持。数据挖掘的关联规则方法就是帮助我们达到这个目的的有力工具。1.2数据挖掘的内涵、过程和方法1.2.1数据挖掘的内涵所谓数据挖掘(DataMining),就是从大

2、量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层含义;数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。什么是知识?从广义上理解,概念、规则、模式、规律和约束等都是知识,而数据可以看作是形成知识的源泉。数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形和图像数据。发现知识的方法可以是数学的,也可以是非数学的;

3、可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是-N交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策。与传统分析方法(如查询、联机应用分析)相比,数据挖掘是在没有明确假设的前提下挖掘信息、发现知识。数据挖掘所得到的信息应具有事先未知、有效和可实用三个特征【1

4、。数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。在商业应用中,数据挖掘是一种新的信

5、息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和模型化处理,从中提取辅助商业2决策的关键性数据。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步模型化的先进有效的方法。图1数据挖掘与其他学科之间的关系Chart1Therelationshipbf=tvveendataminingandotherdisciplines1.2.2数据挖掘的过程数据挖掘的过程包括如下步骤:(1)数据定义和理解:通过使用或创建元数据,定义了解相关领域的

6、有关情况,熟悉背景知识,弄清用户要求,这是创建数据仓库和数据质量改进程序的第一个步骤。(2)数据质量的改进:即执行任何必需的数据清理工作。(3)数据准备:数据准备是数据挖掘的重要组成部分,对前一段产生的数据进行再加工,检查数据的完整性及一致性,其中主要是对噪音数据进行处理,对丢失的数据进行填补。(4)数据挖掘模型开发:选择知识发现的方法,确定模型。(5)数据挖掘:运用确定的数据挖掘模型,从数据中提取出用户所需要的知识,3这些知识可以用一种特定的方式表示或使用一些常用的表示方式。(6)知识评估:包含解释、外攉及模型调整。将发现的知

7、识以用户能理解的方式表示,根据需要对知识发现过程中的某些处理阶段进行优化,直至满足要求。1.2.3数据挖掘的方法图2KDD过程Chart2Theprocessof/fmD我们面对的是大量的隐藏在数据内部的有用信息。如何获取信息是我们所要解决的问题,数据挖掘从一个新的角度把数据库技术、机器学习、统计学等领域结合起来,从更深层次发掘存在于数据内部新颖、有效、具有潜在效用的乃至最终可理解的模式。具体讲,数据挖掘技术有以下几种方法。(1)数学统计方法:使用这种方法一般是首先建立一个数学模型或统计模型,然后根据这种模型提取出有关的知识。如

8、:可由聚类的学习方法从数据中提取出有关的知识。因为机器学习经过多年的研究,已取得了一些较为满意的成果,因此,在KDD中,可以利用目前比较成熟的机器学习方法。(2)面向数据库的方法:随着数据库技术的发展,其中的一些数据处理方法不断完善并趋于成熟,在KDD中,利用现有的数据库技术和某些专门针对于数据库的一些启发方法,可以提取出数据库中的一些特征知识。(3)混合方法:上述各种方法各有其优缺点,为提高KDD的效率,可将各种方法有效地结合起来,取长补短,以发现更有价值的知识。如机器学习中的推4导方法可以和演绎数据结合起来。前者用于知识的推

9、导,后者可以验证发现知识的正确性.还有其它方法,如数据可视化技术、知识表示等等。在实际操作中具体有以下几种主要的数据挖掘方法:(1)关联规则关联规则挖掘(AssociationRuleMining)是数据挖掘的一个重要分支,关联规则是数据挖掘的众多知识类型中最为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。