数据挖掘在采矿工程中的应用

数据挖掘在采矿工程中的应用

ID:40961610

大小:38.00 KB

页数:5页

时间:2019-08-12

数据挖掘在采矿工程中的应用_第1页
数据挖掘在采矿工程中的应用_第2页
数据挖掘在采矿工程中的应用_第3页
数据挖掘在采矿工程中的应用_第4页
数据挖掘在采矿工程中的应用_第5页
资源描述:

《数据挖掘在采矿工程中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、姓名:孙永涛学号:1001010202班级:10级采矿工程(2)班学院:能源与安全工程学院关键词:数据挖掘时间序列煤矿安全瓦斯浓度(一)引言数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘出对用户有价值的模式。目前数据挖掘研究较多集中在关联规则、聚类分析、时间序列数据挖掘等方向。(二)国内外煤矿瓦斯数据挖掘现状早在70年代,世界主要发达国家陆续在采煤安全方面建立瓦斯监测、监控系统。这些系统从建立至今,经

2、过不断的改进、升级,使得这些国家的煤矿的百万吨死亡率大大降低。据统计,美国煤矿百万吨死亡率为0.03,德国煤矿百万吨死亡率为0.04,日本煤矿百万吨死亡率为0.03,等等。这些系统的成功运作,无不证明计算机技术对于传统采煤业安全生产的革命性突破。中国矿业大学就煤矿瓦斯突出的现状,利用数据挖掘技术,以历史数据为基础,与数据仓库技术相结合,通过对历史数据的分析和挖掘,找出隐藏在这些数据内部的关系模式2000年,辽宁工程技术大学几位硕士研究生就此也做了进一步研究。他们用多传感器数融合方法,对瓦斯、温度、风速等信号数据采样

3、,提取它们特征量,对数据进行数据融合,实现对矿井瓦斯进行实时监测、预测控制,取得了较好的效果。但是,对于应用数据挖掘技术则有些不足,他们更多的侧重于硬件设备、系统环境的建设等。(三)时间序列数据挖掘时间序列数据挖掘是基于一个或多个时间序列的数据挖掘,它可以从时序中抽取时序内部的规律包括时序的数值、周期、趋势分析和预测等。时间序列是按照时间顺序取得的一系列观测值[1],很多数据是以时间序列的形式出现的,如股票市场的每日波动,科学实验,一个工厂装船货物数量的月度序列,公路事故数量的周度序列,化工生产过程按小时观测的产量

4、,又如本文将用到的煤矿瓦斯每日浓度统计数据等等。总而言之,时间序列典型的一个本质特征就是相邻观测值的依赖性。时间序列模式的数据挖掘所论及的就是这种依赖性的分析技巧。在统计学中,时间序列可以建立自回归模型、移动平均模型、自回归移动平均模型等等。自回归模型(AR)应用较多的情况是对于经济方面数据的预测,这类数据的特点是在不发生大的经济波动的情况下,数据存在一定的单调性。移动平均模型(MA)主要用于白噪声曲线的处理。白噪声过程,通常称谱密度在整个频率轴上为非零常数,且均为零的平稳过程为白噪声过程,简称白噪声。这种模型多用

5、作对自回归模型的补充和微调。自回归移动平均模型(ARMA)是结合以上两种数学模型而产生的,它综合了自回归把握曲线大致走向的主要特征,与此同时又以移动平均作为曲线微调的依据,所以从理论的角度,应该选择自回归移动平均模型作为瓦斯浓度时间序列数据挖掘的算法。(四)时间序列数据挖掘在瓦斯监测中的一个实际应用一般说来,针对一组为N的动态数据用ARMA模型去识别和拟合,其全过程通常分为以下几个步骤:1、动态数据的预处理;2、模型形式的选择和识别;3、模型参数的初步估计;4、模型参数的精细估计;5、模型阶数的判断;6、模型的检验

6、和改进。4.1动态数据的预处理ARMA型描述的数据要满足平稳零均值条件,因此对数据拟合此类模型之前一般需进行平稳化和零均值的处理,这些工作统称为预处理。本文煤矿瓦斯数据保存在ACCESS数据库中,其中瓦斯浓度表的格式包括以下字段:(时间,安装位置,设备,数据,频率值)。在该表中,时间是按每三秒更新一次,因为是对瓦斯浓度的挖掘,所以只需要保留时间,某一采集点的瓦斯浓度即可。我们采用sql语句提取出23号采集点的时间和瓦斯浓度数据。其浓度变化可生成图4-1:由图4-1可以发现此时间序列不是平稳时间序列,X轴代表时间的采

7、集时刻,Y轴代表瓦斯的浓度(即图中value曲线)。可以看出(0~150)时间序列较为平稳,而在(150~330)这一段较长的时间段内浓度波动很大。图4-1煤矿瓦斯浓度Fig4-1thegasthicknessofcoalmine4.2模型形式的选择和设计根据这一特点,我们采用选择ARIMA(p,d,q)数据模型进行拟合、预测[3]。做法如下:对时间序列进行平稳性处理,平稳化处理的方法有很多种,最常用的差分包括一阶差分和二阶差分,对于时间序列的差分次数,参数d通常只取0,1或2。模型的识别主要依赖于对相关图与偏相关

8、图的分析。在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图,我们在进行完一阶差分后得到的数理统计结果量。4.3模型参数的初步评估模型参数的初步估计具有两个含义和功用,第一,这种估计比较粗糙,只是形式推演和套用公式的结果,估计结果既不依据某种准则,又无极限理论保证。第二,这种估计结果是作为进一步精细估计的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。