欢迎来到天天文库
浏览记录
ID:11001483
大小:57.00 KB
页数:4页
时间:2018-07-09
《基于粗糙集的市场潜在客户预测模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于粗糙集的市场潜在客户预测模型��一、问题提出 随着市场竞争加剧大,如何用历史交易数据预测市场潜在客户,成为研究热点。粗糙集是用已有知识刻画不确定或不精确的知识,确定给定问题的近似域。运用粗糙集预测潜在客户可提高发现效率。 ��二、粗糙集相关概念 (一)近似集 设�X∈U�,�U�上的一个等价关系用�R�表示。当集合�X�能表示成某些�R�基本知识的并集时,称集合�X
2、65533;为�R�的精确集;否则,集合�X�只能以逼近的方式刻画,称集合�X�是�R�粗糙集或不可定义集。 �包含X的最小R精确集称为X的R上近似,记为R(X);X所包含的最大R精确集称为X的R下近似,记为�R�-(X)。即:R(X)={a∈U|[a]�R∩X≠φ} ;R-(X)={a∈U|[a]�R}�X ;称BN�R(X)=R(X)-R-(X) 为X的R边界区域。
3、65533; (二)信息系统与决策表 设四元组�S=(U,A,V,F)�,其中�S�为知识表达系统,�U={X�1,X�2,…X�n}�是对象的非空有限集合,为论域:�A={a�1,a�2,…,a�m}�是属性的非空有限集合;�V=U�a∈A�V�n�是属性值域;�f∶V×A�V�
4、为信息函数,�a∈A,x∈U,f(x,a)∈V�a。� �具有条件属性C和决策属性D,A=C∩D,C∩D=φ�的信息系统称为决策表。 (三)属性的依赖性与重要度 在�S=(U,A,V,f)� 中属性�D对属性C�的依赖度为:�γ�c(D)=|POS�c(D)||U|� �其中POS�c(D)表示D在U/IND(C)上的正区域。γ�c(D)给出属性C用分类
5、特性对分类U/D的全部信息。� �在决策系统S=(U,A,V,f)中,a∈C的属性重要度为:� �SGF��(C,D)�(a)=γ�C(D)-γ��C-{a}�(D)γ�C(D)� �其中SGF��(C,D)�(a)∈[0,1],若SGF�(C,D)(a)=0,则属性a对于D可省略;若SGF��(C,D
6、)�(a)≠0,则属性a对于D不可缺少。SGF��(C,D)�(a) 值越大,属性a对于D就越重要。� ��三、预测模型的设计 基于粗糙集预测潜在客户步骤: 1)明确系统目标,建立相关数据集; 2)数据预处理:对数据包含的空值进行处理,如填入、删除或连续属性离散化; 3)计算条件属性集的约简; 4)产生分类规则,选择和过滤规则。 (一)数据预处理 1.决策表补齐 对不完备的信息表补齐遗漏数据的方法: 1)删除缺损数据,得到完备的数据表,此方法局限于信息表数据量极大而缺损
7、数据量相对很小时; 2)将缺损数据作为特殊属性值处理; 3)通过统计方法,根据决策表中各属性值取值的记录情况估计缺损数据; 4)运用粗糙集建立数据间的不可分辨关系,补齐缺损数据。 2.不完备数据分析方法 空缺数据值的填补要使完整化后的信息系统产生的分类规则具有尽可能高的支持度,尽量集中产生的规则,使信息系统的其他相似对象与具有遗漏值的对象的属性值之间高度一致,使属性值之间差异较小。 3.连续属性值的离散化 运用粗糙集处
此文档下载收益归作者所有