基于spark大数据平台的火电厂节能分析

基于spark大数据平台的火电厂节能分析

ID:35058716

大小:4.71 MB

页数:89页

时间:2019-03-17

基于spark大数据平台的火电厂节能分析_第1页
基于spark大数据平台的火电厂节能分析_第2页
基于spark大数据平台的火电厂节能分析_第3页
基于spark大数据平台的火电厂节能分析_第4页
基于spark大数据平台的火电厂节能分析_第5页
资源描述:

《基于spark大数据平台的火电厂节能分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、-二...y—'分类号‘;VL密级...一.入r..I.’.‘-./.!太原理工大学胃硕±学位论文^r長产货r题目基于如ark大数据平台的火电厂巧能分析.’V'古;ThermalPower巧antEnergySavingAnai‘vsisBasedonSpark?英文井列题目BigDataPlatform产i.\;'.■.1::占-社可巧.I'1研究生姓名-u聖堂.與::..共哨K^.2

2、013510265..普._/尸.,学^;冻、专业工g:测科学与游%I'究方向机財习连養.导师姓名:——j咬I.-.巧'^,.育..去■■U’情織坚技綱交日歷地址?太原^:山西'.-'井.'芳?,:六大、驚:^譯3沪巧4王大皆'■拂設達態■矿早yr声明本人郎重声明:所呈交的学位论文,是本人在指导教师的指导下,独立进行研究所取得的成果,本论文不包含。除文中已经注巧引巧的内容外其他个人或集体己经发表或撰写过的科研成果。对本文的硏究做出重要贡献的个人

3、和集体。本声明的法律责任由本人,巧己在文中W明说方式标巧承担。论文作者答名:日期:王。Ih.L邸关于学位论文使用权的说明本人完全了解太原理工大学有关保管、使用学位论文的规定,其中包②学括:①学校有权保管、并向有关部口送交学位论文的原件与复印件;校可W采用影印、缩印或其它子复制手段复制并保存学位论文;③学校可化许学位论文被查阅或借阅,复制赠送和交;④学校可W学术交流为目的换学位论文;⑥学校可公布学位论文的全部或部分内容(保密学位论文在解密后遵守此规定)。签名:杂汽日期;如".女iW

4、/J.化导师签名I日期:_印叶—太原理工大学硕士研究生学位论文基于Spark大数据平台的火电厂节能分析摘要在相当长的一段时间内,我国以煤为主的能源结构不变,煤炭占总能源比例及火力发电比例将很难低于50%。因此,发电企业面对目前严格的火电厂排放标准,必须采取一切措施实现发电过程的节能减排。目前,电力发电企业在锅炉、汽机等设备的运行过程中积累了丰富的历史数据,本文从挖掘电厂的节能潜力出发,借助国电大同某电厂的SIS系统中的历史数据,利用Spark分布式大数据计算平台及相关技术对电厂相关指标进行了建模研究,主要工作内容如下:(

5、1)对电厂现阶段的发展现状及所面临的问题进行了调查研究,并从氮氧化物的建模出发对电厂某段时间内的样本数据进行建模预测,并得到较好的预测效果。(2)建立了大数据/云计算的基础存储及计算平台Hadoop,Spark系统等。对Spark平台上的核心RDD进行了研究学习,并利用随机森林、梯度提升回归树及普通决策树完成了对氮氧化物的预测建模,将任务提交到yarn资源管理系统进行分布式计算,并将结果保存到HDFS,从不同角度比较了随机森林及梯度提升回归树方法在氮氧化物建模中的实际效果,对比之后发现随机森林模型更适合用于该污染物的建模。(3)分

6、析比较了不同计算框架的优劣,选取了适合本研究的硬件及软件系统;同时对比了不同存储系统及其优缺点,选定了本文所需要的存储I太原理工大学硕士研究生学位论文系统;收集整理了可在Spark平台上可并行化的机器学习算法库,并进行了相关算法的测试。(4)对电厂PI实时数据库中的数据进行了采集、清洗、对齐及相关预处理,保证了数据安全的同时保证了数据的质量。使预处理后的数据转化为Spark机器学习库Mllib所需要的格式。(5)对建模结果进行了分析,抽取出树模型中根节点附近的变量,发掘出这些测点与污染物之间的关系,从全厂出发分析了电厂的主要经济指

7、标,并对不同负荷下电厂主要运行参数进行了挖掘。试验结果表明,基于Spark平台的随机森林算法可以很好的对氮氧化物进行建模,模型的参数调整好之后,其预测结果较好,并且随机森林模型消耗的时间在可接受范围内。同时,将随机森林和梯度提升树算法用于氮氧化物的k步预测,并做相应试验,从结果可以看出,对于多步预测问题,随机森林模型同样比梯度提升树有一定的优势,可很好的学习出数据中的特征,并对氮氧化物进行预测建模。最后,对电厂其它环节及设备的节能及相关建模分析方案进行了设想及展望,对该研究未来的工作提出了一定的意见及设想。关键词:火电厂;Spar

8、k;Hadoop;大数据机器学习;分布式算法;决策树;随机森林;梯度提升回归树II太原理工大学硕士研究生学位论文ThermalPowerPlantEnergySavingAnalysisBasedOnSparkBigDataplatformABST

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。