基于决策树的短期负荷预测系统研究与实现

基于决策树的短期负荷预测系统研究与实现

ID:22318949

大小:1.79 MB

页数:33页

时间:2018-10-28

基于决策树的短期负荷预测系统研究与实现_第1页
基于决策树的短期负荷预测系统研究与实现_第2页
基于决策树的短期负荷预测系统研究与实现_第3页
基于决策树的短期负荷预测系统研究与实现_第4页
基于决策树的短期负荷预测系统研究与实现_第5页
资源描述:

《基于决策树的短期负荷预测系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文构、数据库设计及功能实现方面内容。具体各章节安排如下:第一章:绪论,介绍了负荷预测及负荷预测系统的背景及现状,提出了本文课题的来源并提出了本文的目标。第二章:相关算法介绍,对本文将要应用或改进的算法进行了系统而详尽的阐述。介绍了生成决策树的ID3算法,及ID3算法在负荷预测的应用中不可避免要遇到的聚类问题,并介绍相关聚类算法。第三张:针对海南电网的决策树模型,在研究了海南具体数据后,分析同类应用的决策树方法并提出了自己的改进,建立了针对海南电网负荷特点的决策树模型编写代码实现并测试,与同类结果对比验证,证明了改进的有效性。第四章:负

2、荷预测系统的设计与实现,介绍了海南电网负荷预测所用到的相关技术,详细阐述了系统设计、数据库设计。最后实现了系统,并用丰富的图例展示。第五章:总结与展望,总结了本文的工作,指出了本文工作的不足以及以后的改进之处。4华中科技大学硕士学位论文2相关算法介绍2.1引言如前所述,负荷预测方法众多,各地影响负荷的因素不同,目前还没有一种算法在所有情况下都适用。在海南电力系统负荷预测中,由于各种外界非负荷因素(甚至是人为的拉闸限电等)影响了数据的真实性,使得一些传统方法不再那么适用。如果说历史数据集合已经包含了所有可能出现的情况,对已知将来某些条件(属性)的预测就变成了

3、对这些已知属性的分类问题。而决策树方法在分类中已经得到了广泛的应用,尤其是在金融、工业生产领域中[10]。在负荷预测领域,近年来也引入了决策树方法,并取得了一定效果[11][12][13][14]。本文将用决策树对预测日属性进行分类,从历史样本集中得到预测结果。决策树生长采用ID3算法,对某些属性的聚类采用K均值聚类法。2.2决策树分类简介决策树是目前最常用的分类算法,自20世纪60年代以来开始得到广泛应用。决策树分类优点是简单而有效,结果集易为人所理解。决策树以实例数据集作为归纳学习的基础,能从看似全然无序杂乱无章的历史数据中找出内在联系,推理出符合人类

4、逻辑的分类法则[15]。决策树是树状结构,决策树的生成也有两种形式:自上而下和自下而上。目前普遍应用的是自上而下的方式。即从根节点开始对历史数据(测试集)属性进行测试,测试方法及为生成决策树的算法,一个测试点即为决策树的一个节点,称为决策点。在各个决策点,根据测试的结果将样本实例集划分成不同的子集;再对每个子集重复上述操作。直到每个节点中的样本数小于一个给定值,此节点就作为一个叶节点,并停止生长。当所有节点成为叶节点的时候,整个决策树停止生长[10]。从决策树生成来看,决策树有着生成简便,结构简单,易于理解的优点;其次决5华中科技大学硕士学位论文策树并不需

5、要训练集以外的任何知识或参数,得到的分类结果也必然在解空间中,不可能存在不收敛或无最优解的情况。一棵决策树生成的效率与其分类的准确率是由决策树分类算法所决定的。目前主要的决策树生成算法有:CLS、ID3、C4.5、CART、CHAID等。2.1ID3算法2.3.1ID3算法简介1966年,Hunt、Martin、Stone提出了CLS算法。以后的所有决策树生成算法都是在CLS算法上的改进,ID3也不例外。ID3算法在1975年由Quinlan在悉尼大学提出,收录在《MachineLearning》中[15]。一棵决策树是由分析某些历史数据的样本得到的。每个

6、样本都具有各自的属性并属于最后的某一具体结果子集中(在负荷预测中,这个结果集就是一个确定的负荷值)。这些结果子集就是决策树的叶节点,而决策点就是这棵决策树的中间节点。在每个决策点中对样本进行此决策点属性的测试,以便将其分到各个不同的子集中。ID3算法的核心是使用信息增益量来决定每个决策点使用的决策属性[17]。为了具体说明ID3算法,先介绍原始的CLS算法。CLS算法流程如下:1)如果当前集合中所有实例都属于正面(positive),则生成yes节点并停止。如果当前集合中所有实例都属于反面(negative),则生成no节点并停止。其他情况则重新选择一个属

7、性F(含有v1,v2到vn等不同属性值),并用F进行测试,使当前节点变为一个决策点;2)依照F中的不同属性值(v1,v2等)将当前集合中的实例划分到不同子集:C1,C2…Cn中;3)对每个子集重复上面的过程。在CLS算法中,操作人员可以自主选择测试属性。ID3的改进之处在于提供了一条自主选择最优属性的方法,可以自主选择当前训练实例中的最优属性来进一步划分当前集合。如果测试属性能够很好的区分训练集,ID3算法终止;如果不行则对所有属性F1到Fn中的所有取值进行循环计算来试探的划分子集,来得到当前“最优”属6华中科技大学硕士学位论文性。ID3是一种贪心算法,即

8、算法不会再次使用已经使用过的属性。ID3也是一种保守算法(noni

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。