基于粗糙集及ac聚类算法用电客户信用知识挖掘

基于粗糙集及ac聚类算法用电客户信用知识挖掘

ID:33701176

大小:64.17 KB

页数:9页

时间:2019-02-28

基于粗糙集及ac聚类算法用电客户信用知识挖掘_第1页
基于粗糙集及ac聚类算法用电客户信用知识挖掘_第2页
基于粗糙集及ac聚类算法用电客户信用知识挖掘_第3页
基于粗糙集及ac聚类算法用电客户信用知识挖掘_第4页
基于粗糙集及ac聚类算法用电客户信用知识挖掘_第5页
资源描述:

《基于粗糙集及ac聚类算法用电客户信用知识挖掘》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于粗糙集及AC聚类算法用电客户信用知识挖掘【摘要】用电客户信用关系是供电企业客户关系管理的重要内容。在分析对用电客户的信用评价指标体系的基础上,提出基于粗糙集及AC聚类算法的用电客户信用评价模型。首先借助粗糙集理论,对指标进行属性约简,并运用自组织数据挖掘中的KnowledgeMiner软件,采用AC聚类算法对用电客户进行聚类分析,从而得到各个用电客户的信用等级。最后结合聚类结果,利用ID3算法,建立决策规则,得出具有一般指导意义的用电客户信用评价的规则知识。【关键词】粗糙集属性简约;AC聚类;ID3算法

2、;用电客户1.引言(1)随着电力体制改革的推进和电力市场化进程的加快,供电企业在电力市场上面临着越来越激烈竞争。一方面,用电客户逐渐成为竞争的焦点,提高用电客户满意度与供电企业自身的经济效益紧密相关;另一方面,供电企业先消费后付款的特殊交易方式,造成有些用电客户拖欠电费。因此,供电企业需要对用电客户进行有效的信用评价,对不同信用等级的客户采用不同的营销策略,建立信用激励机制,提高供电企业用电营销辅助决策水平。(1)目前,随着用电客户信用评价成为供电企业客户关系管理的重要内容,有关用电客户信用评价方面的研究成

3、果也在不断的增多。目前常用的方法主要有综合评估法[3]、模糊多属性方法[4]、主客观评价的方法[5]、模糊偏序方法[6]等。这些研究从不同角度,为解决用电客户信用评价问题提供了一些值得借鉴的思路和方法。上述方法在进行用电客户信用评价时各有特点,但其评价指标较多,精炼性稍显不足。随着信用评价体系指标不断增多,指标之间不可避免的存在一定的关联性、交叉性,其重要性也不尽相同,从复杂的指标体系中筛选出重要的指标也是进行用电客户信用评价的一个重要方面,因而本文把在指标属性约简方面具有强大优势的粗糙集理论引入用电客户的

4、信用评价中。(2)粗糙集是一种处理不精确、不相容和不完全数据的数学工具,这一理论主要的应用是对含有大量冗余信息的知识系统进行约简,它不仅具有模拟人类逻辑思维的能力,而且能有效地分析和处理不精确、不一致、不完整的信息[9]。该方法的主要优点在于它不需要预先给定某些特征或属性的数量描述和模型假定,但单纯地使用粗糙集理论不一定总能有效地解决不精确或不确定的实际问题。因此本文在粗糙集基础上,采用AC聚类的方法,实现对用电客户的信用评价。最后结合ID3算法,得到用电客户信用评价的决策规则,具有一般性的指导意义。1.基

5、本原理2.1粗糙集理论[1,12]o2.1.1定义1某个属性子集PA,x,yeu为两个数据实体,如果有aGB,f(x,a)=f(y,a)这时称x,y在属性集A上是不可分辨的,也称为等价关系。在信息系统中,不可分辨关系可以定义为:IND(P)={(x,y)eUXUIaUP,f(x,a)二f(y,a)}由这种等价关系导出的对U的划分记为U/IND(P)o2.1.2定义2粗糙集理论的不确定性是建立在上、下近似的概念上的。令XU是一个集合,IND(P)是U上的等价关系,贝1h上近似集IND(P)-(X)=U(Yeu

6、/IND(P),YX},下近似集IND(P)-(X)=U{YeU/IND(P),YGXH}设T二(U,A,C,D)是决策表,如果去掉属性a,得到的表Tl=(U,A-{a},c-{a},D)与表T=(U,A,C,D)相比,有PosC(D)=PosC-{a}(D),则称属性a是关于D可省的。其中,PosC(D)=UXeU/IND(D)P-(X)是D关于P的正域。相对于决策属性集合,如果有无条件属性Ci对决策属性集合的影响不大,则可认为Ci的重要程度不大。属性集中Ci的重要度可表示为[9]:(D))/cardU(

7、i)=card(PosC(D)-PosC-ICiI(U)(1)其中,card为元素个数属性。根据所求得属性的重要度,可以获得其在属性集合中的相对权重。对求得的属性重要度进行权值化处理可得[9]:wi=p(i)/Zni=lu(i)(2)其中,wi是第i项属性的权重,n(i)为第i项属性的属性重要度,n为属性的个数。2.2AC算法的原理。(1)由Laurence发展起来的相似体合成算法AC(AnalogComplexion)首先成功地应用于气象的预测,经过不断的发展与改进,在理论和应用方面取得了不少突破性的进展

8、,已经能够取得很好的预测效果。后来乌克兰的A.G.Ivakheneko院士把它应用于聚类,并且把AC算法和GMDH结合起来,将GMDH的核心思想应用到AC聚类算法中。国内对AC算法的研究主要是建立在四川大学贺昌政教授研究的基础之上。(2)AC算法可以看作是对复杂对象的预测、聚类和分类的一种序列模式识别方法[14]。AC聚类算法,假设每个样本(或者变量)作为一个模式,通过计算其他模式与该模式的相似程度,从而把较为相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。