资源描述:
《毕业论文(设计)基于数据挖掘算法的地铁站内温度时序预测方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于数据挖掘算法的地铁站内温度时序预测方法摘要:提出了基于数据挖掘算法的地铁站内环境温度时序预测的方法。分别建立了支持向量数据(SVR)、BP神经网络、决策树三种预测模型,对比了-・般的输入■输出建模方法与基于时间时间延迟方法的预测结果,以及不同时间延迟下三种数据挖掘模型的预测结果。结果表明:基于时间序列的预测模型效果比一般的输入-输出模型效果更好;当吋间延迟为1时,三种模型的预测精度相对较高,且在此条件下,模型的预测效率也最高;基于SVR的时间序列预测模型精度比BP神经网络和决策树更高.关键词:数据挖掘时序分析地铁站站厅温度引言地铁站作
2、为乘客从地面到乘车的过渡环境,保证其舒适性、安全性是地铁站运营的工作重点之一。地铁站位于地下、自然通风条件较差,内部环境的维持主耍依赖于暖通空调(HVAC)系统。相比于地面建筑,地铁站最大的特征Z—是人员流动频繁,客流量急剧变化容易引起站内环境温度的波动,出现客流高峰时期站内温度偏高,客流高峰过后温度偏低等现彖。这既影响了地铁站的舒适性,同时在一定程度上增加了空调用能。因此,如果能够通过提前预测站内环境温度的变化,进而优化HVAC系统控制,改善客流变化引起的舒适性变化,并减少市于滞后控制引起的机组能耗,这对于地铁站节能与舒适性控制有重要的
3、理论意义和研究价值。已有的文献中对于地铁站站厅环境温度的预测研究鲜有报道。传统的方式是通过建立仿真平台进行模拟,但这些模型通常是稳态或半稳态的,不适合于处理高频率的扰动因素,导致其结果与实际情况有差异⑴。本文提出了基于数据驱动的地铁站内环境温度的建模。通过对收集的地铁站实测数据进行分析,用相关系数描述了不同变量与地铁站站厅温度Z间的相关关系;利用支持向量数据(SVR)、BP神经网络、决策树CART三种数据挖掘算法建立了预测地铁站站厅温度的时间序列模型,通过建立性能指标评价三种模型的预测结果,得到了最佳的预测模型。1基于数据挖掘算法的时间序
4、列预测模型常用数据挖掘算法可以分为两类:有监督算法、无监督算法。其屮常用的有监督算算法包括:支持向量机、人工神经网络、决策树、随机森林等;常用的无监督算法包括聚类分析、关联规则分析等⑵。本文采用有监督算法中的SVR、BP神经网络和决策树CART算法进行建模分析。1.1支持向量回归(SVR)支持向量回归rti于其良好的泛化性被广泛用于能耗、电力预测等方面4Jo对于给定的训练数据集合{(也」),21,2,...,N},SVR利用非线性映射0:兀T仅旺)将数据集映射到m维特征空间,其特征空间的回归函数可以表示为:为了计算(1)中的閔口4并使得估
5、计真实风险最小,构建如下目标函数:11JV卿訓+C戒X+GX-(坷心“+历金+纟并服从:<(69^9(X-)+/?)—yi5£+$弘0点nO,i=l,2,..・,N在本文中,选取了&不敏感惭数作为模型的损失幣数,&SVR模型计算出的支持向量具有稀疏性,模型结构较为简单。1.2BP神经网络BP神经网络是一种多层前馈网络,包含输入层、隐含层和输出层。通常采用梯度下降法调整权值和阈值使网络的实际输岀值和期望输出值的均方误差最小⑸。对于隐含层,其表达式为:hj=/(X吗兀+勺),j=1,2,…,m(3)/=
6、砌为输入层第/个节点与隐含层第./•个
7、节点之间的连接权值;/为隐含层激励幣数;cij为隐含层第/个节点的阈值。输出层的表达式为:A=^hjCOik+仇,R=1,2,・..,/(4)J=i为第丿•个隐含层节点与第k个输出层节点之间的连接权值;bk为第k个输出层节点的阈值。1.3决策树决策树通过树形结果将数据集从根节点分布至各个叶节点,组成不同的类別用于制定决策。其中,CART决策树作为最广泛使用的决策树之一,既能够处理逻辑性数据集,也能解决数据屮的缺失问题⑹。对于回归问题,CART树的每个节点的分裂规则定义为使该节点的二次方差最小,即:L_RminRE(〃丿=工(幵一九尸+工(
8、儿-yR)2(5)/=0r=0其屮X和升为节点的左、右分支,L和R分别为左右分支的样本个数,z和弘分别为左右分支的平均输出,对于所有取值,使得二次方差最小的划分作为父节点,并以此创建子节点,每个子节点再以同样的方式递归产生下一个父节点,直到不能再创建子节点为止。2时间序列预测原理及模型性能评价指标2.1时间序列预测原理吋间序列分析模型是数据挖掘中常用的工具,建立在系统观测数据基础上的吋I'可序列模型可以用來研究系统运行状态或预测未來值⑺。经典的线性时序模型ARMA、AR、MA以及ARIMA的建模算法已经获得诸多成果⑻%但是,实际工程中的系
9、统都是非线性的,传统的线性模型在预测精度上难以满足实际应用。因此,将传统的时序算法与数据挖掘算法结合,用于建模非线性系统,是目前的研究热点之一。非线性时间序列模型主要包括有外在输入的非线性自回