基于智能决策树和人工智能网络的电力营销

基于智能决策树和人工智能网络的电力营销

ID:14189117

大小:87.50 KB

页数:5页

时间:2018-07-26

基于智能决策树和人工智能网络的电力营销_第1页
基于智能决策树和人工智能网络的电力营销_第2页
基于智能决策树和人工智能网络的电力营销_第3页
基于智能决策树和人工智能网络的电力营销_第4页
基于智能决策树和人工智能网络的电力营销_第5页
资源描述:

《基于智能决策树和人工智能网络的电力营销》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于智能决策树和人工智能网络的电力营销牛伟华(华北电力大学保定计算机系071003中国)摘要:本文介绍了在电力营销中一种采用人工智能网络的新方法。在数据预处理中使用智能决策树分类算法以确保数据优化,这种关于人工智能网络隐藏节点的算法逐步得以改进,人工智能网络的计算复杂度已经逐步降低。实验结果表明人工智能网络模型在电力分布上具有很好的预测效果。关键词:智能决策树;人工智能网络;数据预处理;电力营销1.引言作为人工智能的一个分支,神经网络的研究从80年代中期开始变得越来越火。神经网络在预测上具有独特优势,拥有比其他统计方法更高的精确度。因此成为解决电力营销问题的有效工具。神经网

2、络采用字符数据驱动,模型中使用的数据从训练实例中获得,它取决于抽样的数量和质量。由于电力营销领域的数据杂乱无章,因此神经网络研究的关键问题即在于分析和整理原始数据,满足神经网络的需求,保持数据的原创性。决策分类数算法善于处理高维数据问题并能获得很好分类结果,因此它给我们提供了一种分析电力营销原始数据的新方法。2.决策分类算法决策树是用于分类的一种树形结构。每个内部节点代表一种测试属性,每个边界节点代表一种测试结果,每片叶子代表一种分类。决策树的顶节点即为根节点。如图1所示即为决策树在商业贸易中的一个实例。图1决策树分类过程5决策树对出售的电脑进行了分类,并确认消费者是否购买

3、电脑。每个内部节点(方框)代表某种测试属性,每个子节点(椭圆框)代表一种分类(购买电脑=是或者购买电脑=否)。在这个实例中,样本向量如下:(年龄,学生,资信评级,购买电脑),数据格式按(年龄,学生,资信等级)分类。新记录能找到它所属的分类。按决策树分类分为两步。第一步是按样本生成和简化一个决策树。事实上就是一个从数据集合中采集信息和发展机理的过程。第二部是不输入的数据按已有的决策树进行分类。对于输入记录,试验决定从根节点到子节点的记录价值,并依次进行分类。决策树的基本算法是贪心法。它采用自上而下的格式,解决每个子问题,并生成决策树。3.基于决策树算法的数据预处理3.1电力营

4、销领域的数据特性通过测量与控制仪器采集的原始数据有很多缺陷,例如噪声、失真和损失。在负载的数据收集中尤其突出。在将原始数据直接作为试验样本和人工智能网络输入的条件下,我们不能很好地确保其预测性。因此对原始数据的预处理显得极为重要。众所周知,电力系统(负载,电容等)的数据对天气、季节、温度、降水等自然条件和休假、重要节假日等人为因素极为敏感。例如,夏季的气温明显高于春季气温,这就导致居民空调的电压升高,负载电路的载荷也会上升到一个更高的层次。因此电力系统地数据不是一个简单的数值,而是包含很多因属性(如气候、温度和降水等)。系统地数据会以向量格式呈现,一个简单的向量格式可写为:

5、(A1,A2,…,An;data)。An代表数据属性,data代表数据数值。这种数据格式非常适合用于决心树算法的数据分类。3.2传统数据预处理方法的缺陷电力营销中数据预处理主要包含四个步骤:数据采集,数据分类,异常筛选和数据缺陷补偿。通常需要解决的问题是数据分类、异常筛选和数据缺陷补偿,数据缺陷补偿是关键步骤。因为在不同的数据分类中辨别异常数据毫无意义,并且缺陷数据补偿也依赖于更改数据分类。当前有许多数据预处理方法,主要常用的方法如下:(1)直接删除异常数据;(2)将异常数据视为特殊属性;(3)采用统计方法,在信息表中估算异常数据属性值的分布状态;(4)采用模糊集方法分析和

6、补偿数据;(5)最后一种方法是粗糙集方法,把分类当作基本概念,把错误关系当作基础,在已有数据与补偿数据中之间建立非对应关系。这些方法的缺陷是没有考虑数据重要属性对数据分类的影响。因此按上诉方法对电力营销数据进行预处理不能获得最优结果。53.3数据决策树算法在电力营销中的应用尽管存在上述情况,采用决策树分类算法能够补偿传统数据预处理的缺陷。关键在于将信息表中的数据分为属性值和非属性值,替代了以往那种对所有属性值求算术平均值的方法,那种方法会将一部分不完整的数据也包含在内。也取代了之后那种采用所有试样属性值出现频率最高的方法。基于电力营销系统地真实数据,采用智能决策树算法,依据

7、数据属性值,对数据非属性值进行了分类。取而代之的是出现频率最高的非属性值,同时采用对所有数据求算数平均值的方法取代属性值。事实上,我们选取了五组数据,将开始数据与结尾数据和不完整数据归为一类,视为不完整数据。并且计算十组数据的属性值修正不完整的数据。4.系统应用4.1电力营销的数据预处理由于电力系统的数据对气候因素特别敏感,气候因素扮演电力系统数据的属性值。我们建立电力系统数据的一个矢量格式如下:(季节,温度,降水,休假,重要节日;数据)季节:(春季:3-5月;夏季:6-8月;秋季:9-11月;冬季:12-2月)当

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。