资源描述:
《基于随机森林的风机监测数据可视化研究-电测与仪表》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于随机森林的风机状态监测数据可视化研究*基金项目:吉林省重点科技成果转化项目(20150307020GX),;吉林省科技厅重点攻关项目(20150204084GX)郭晓利,温延立(东北电力大学信息工程学院,吉林吉林,132012)摘要:针对风电机组状态监测数据可视化存在的直观性不强和交互性差等缺陷,提出基于随机森林的可视化技术。即首先对监测数据进行基于RF的相似性度量,使数据在新特征空间的类可分性增强;然后采用主成分分析法进行特征变换与降维,将多维数据的关系信息变换到适合人类视觉认知的低维空间里;最后对数据在
2、低维空间里采用散点图和平行坐标图进行可视化展示。实验结果表明,风机状态监测数据经过RF处理后,可视化效果良好,便于管理人员从整体上把握数据的集中特性、分布规律以及属性间的关系等信息,对提高风电机组的运行可靠性具有重要意义。关键词:电力大数据;随机森林;风机状态监测;可视化;平行坐标中图分类号:TM93文献标识码:A文章编号:1001-1390(2016)00-0000-00Datavisualizationresearchonmonitoringdataofwindturbinesbasedonrandomfo
3、restGuoXiaoli,WenYanli(SchoolofInformationEngineering,,NortheastDianliUniversity,,Jilin132012,,jilinJilin,China)Abstract:Thecurrentmonitoringdatavisualizationofwindturbinessuffersfrompoorinteractivityandlessintuitiveness.Inthispaper,avisualizationmethodtechn
4、ologybasedonrandomforestisproposed.Firstly,therandomforestwasusedforsimilaritymeasurementonmonitoringdata,whichenhancedtheseparabilityinthenewfeaturespace.Then,theprincipalcomponentanalysis(PCA)isadoptedtoreducethedimension,bythroughwhichtherelationshipbetwe
5、enofthemultidimensionaldatainformationistransformedintolowdimensionalspaceforhumanvisualperception.Finally,thedatainlowdimensionalspaceusingascatterdiagramandparallelcoordinatesfigureisdisplayed.Theexperimentalresultsshowsthattheconditionmonitoringdataofwind
6、turbinesprocessedwiththerandomforest,hasagoodvisualeffectandit’seasyforthewindturbinesmanagertofigureoutthedatacharacteristics,distribution,developmenttrendandtherelationshipbetweenattributesonthewholegrasp.It’sofgreatsignificancetoimprovetherunningreliabili
7、tyofwindturbines.Keywords:electricpowerbigdata,randomforests,monitoringdatastateofwindturbines,visualization,parallelcoordinates0引言现代大型并网风电机组SCADA系统每10min刷新一条数据,监测数据量呈指数级增长,庞大的风机状态信息量给风电场运行管理人员带来了“数据灾”问题[1]。可视化技术成为大数据挖掘分析的有效途径,目前可视化技术在风机状态监测方面的应用有很多,然而,风机状态监
8、测数据可视化还存在以下问题[2]:(1)直观性不强现有的风电监测数据通常直接以数据表格呈现出来或经过软件平台处理后以曲线形式表现出来,需要专业人士经过分析研究后才能作出判断,监测人员无法及时直观地了解机组运行状况,不利于对潜在故障信息做出快速处理;(2)交互性差风机状态监测数据参数众多,数据量大,直接将其进行可视化展示,会产生可视化混乱,且用户无法参与可视化过程,不能主观的进行决策推理