大数据挖掘工业锅炉性能升级研究.doc

大数据挖掘工业锅炉性能升级研究.doc

ID:61766070

大小:30.00 KB

页数:5页

时间:2021-03-19

大数据挖掘工业锅炉性能升级研究.doc_第1页
大数据挖掘工业锅炉性能升级研究.doc_第2页
大数据挖掘工业锅炉性能升级研究.doc_第3页
大数据挖掘工业锅炉性能升级研究.doc_第4页
大数据挖掘工业锅炉性能升级研究.doc_第5页
资源描述:

《大数据挖掘工业锅炉性能升级研究.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、大数据挖掘工业锅炉性能升级研究摘要:以600MW燃煤发电机组为基本对象,向其中引入大数据挖掘技术,在其支持下探寻影响锅炉效率的典型因素,确定与各项参数相适应的最佳设定值。经研究得知,实行与大数据特性相符的计算方法,可获得适用于锅炉运行特性的目标值,以达到提升锅炉工作效率、节能减排的效果。关键词:大数据挖掘;锅炉性能;优化研究置身于互联网大背景下,各领域都被贴上数字化的标签,于电力行业而言亦是如此,正逐步朝着信息化的方向发展,现阶段以监控信息系统的应用最为广泛,受惠于现代信息技术,可确保各类数据的完整性,实现对数

2、据的有效存储[1-2]。1相关工作背景5学海无涯1.1粗糙集理论。Pawlak经研究后提出粗糙集理论,其基本应用对象为信息数据系统,依托于粗糙集理论可实现高效化的数据分类,并确保信息分类能力的稳定性,使其在较长一段时间内不发生改变[3]。相较于前人的研究理论而言,Pawlak所提出的理论能够简化问题解决思路,实际分析工作中无需得到除数据库外的其他知识的支持,且具备与其余理论互补的条件。在长期发展之下,粗糙集理论已经得到广泛应用,在临床医学等领域均见其身影。粗糙集理论的鲜明特点在于属性约简,选取原始特征,在此基础

3、上经筛选后获得最佳子集,并进一步选择突出特征,将大量无用数据删除,达到有效缩小数据维度的效果,有助于提升数据的研究效益[4-6]。本文也充分运用了粗糙集理论,引入了决策表属性约简算法,从而达到属性约简的效果,具体流程如图1所示。1.2Hadoop平台。依托于MapReduce主框架,可实现对数据的分析,此处采取的框架形式具有较强适用性,可实现对多类大数据问题的处理。其内置有Map和Reduce函数,具体指的是映射与归约函数,在其支持下可实现对数据的高效处理。立足于实际情况,针对数据源展开分散处理,基于<key,

4、value>键值,在其作用下可实现对函数值的输入与输出。各数据块都存在与之相对应的Map函数,能够达到数据计算结果输出的效果,随后再针对输出数据实行排列,产生Reduce函数输入值,以便给后续计算工作提供支持。关于MapReduce框架的运行流程,具体内容如图2所示。2RCK-means新算法流程通过上述提及的MapReduce,经顺序组合后可得到特定程序,即RCK-means算法。类似于上述操作机制,需执行属性约简操作,实现对数据原件的处理,随后再一次执行Canopy与K-means子框架。关于各流程,具体内

5、容如图3所示。(1)在粗糙集理论的支持下,可形成初始决策表,并判定具体的条件与决策属性,通过对各自属性依赖度的分析,实现进一步的属性约简处理,经此环节后可筛除大量无关数据,余下的有用数据便可构成特性集合。(2)通过Canopy算法中的Map函数,可实现对新数据几何的转换,使其成为与<key,value>键值相对应的方式,随后分别置于多个Map函数中以便做后续计算处理,求得各数据块对应的距离阈值,以D1、D2为基准,将所得结果与之对比分析,经迭代处理后产生集合,具体指的是Canopy集合。(3)通过Reduce函

6、数,可实现对上述Map结果的进一步处理,即并集操作,此时可以得到Q集合,随后再运行Canopy流程,针对既有的程序展开多次处理,最终使得集合为空,便可求得聚类簇K,获得此结果后可将其作为输入值,以便做后续的处理。(4)在上述基础上,通过K-means算法中Map函数,可求得聚类簇,将所得结果通过<key,value>键值对输入,便可求得节点与中心点距离,将上述操作后所得的结果汇总,展开分类处理,并采取相同的方式将结果输出。(5)基于Combine函数,能够实现对上述输出值的处理,将其分类后再数据归集,在求得各数

7、据维度值的基础上,做进一步的总和计算。(6)通过K-means算法中的Reduce函数,针对(5)中求得的结果加以分析,考虑各数据的维度值,为之实行总和计算,并明确数据的具体数量,随后可创建新的聚类中心,以此为基础重新迭代,最终收敛。3在锅炉效率优化中的研究5学海无涯3.1运用大数据技术的意。义较为典型的优化方式有两种:第一,从燃烧器与受热面入手,为之采取升级整改措施,从而达到提升运行效率的效果,或是适配先进设备,在其支持下实现对参数的监测。尽管此方法的应用效果良好,但对于人力与财力的需求较大,因此经济效益较低

8、。第二,基于DCS的数据挖掘技术,从而实现对锅炉性能的分析并确定合适的参数,此方式模型优化工作量相对较大,且在实际处理中易出现样本获取难度大的情况,不具备较高的实用性。DCS系统储有丰富的数据,将其作为实行大数据技术的基本支持,创建严密的计算流程,针对热力系统中涉及到的大量数据展开分析,从中确定与锅炉效率有关的几项参数,分析具体参数值与理论的误差,经此方式所得的参数值则具备作为最佳参数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。