欢迎来到天天文库
浏览记录
ID:11650342
大小:55.00 KB
页数:16页
时间:2018-07-13
《利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、利用数据仓库/数据挖掘技术构建DC-CRM模型_CRM_管理信息化1引言 随着“集中交易”在证券行业的逐步普及,交易数据的集中程度也日益提高。目前,在中等规模的集中交易系统中,股东开户数一般为10的五次方量级,而在规模较大的系统中,这一数字可高达1的六次方量级,交易记录数更是十分惊人。传统CRM系统的开发条件与工作环境与现实情况间的差距不断增大,在处理速度、功能种类、分析深度等方面,均难以满足实际工作的需要。因此,构造适应证券业数据集中环境的CRM系统的需求就显得十分迫切。 作为信息科学的一个重要研究领域,数据仓库和数据挖掘技术是数据库技术发展
2、到一定程度的产物。按Inmon的定义,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。而在数据仓库基础上的所谓数据挖掘,亦称数据库中的知识发现,就是在海量数据中探索数据间的关系、并从中提取有效的、新颖的、有潜在价值的知识和规律的过程。数据仓库与数据挖掘技术的结合,不仅能提高数据仓库对决策的支持能力,也能大大提高数据挖掘的工作效率。本文借助数据仓库/数据挖掘技术,设计了一个证券业数据集中环境下的CRM系统模型:DC-CRM(DataConcentriltedClientRelationshipManagement)
3、和传统CRM系统相比,DC-CRM模型具有以下特点: ·数据来源更广泛:除客户资料外,还包括交易、行情和证券基本资料等方面的数据; ·系统运行更高效:借助数据仓库技术,可以高效管理海量的数据内容; ·揭示隐藏的知识:运用数据挖掘技术,能揭示隐藏在数据背后的知识,对实际工作具有更强的指导意义。2DC-CRM中数据仓库的构建 DC-CRM的核心部分,就是针对数据集中环境而设计的数据仓库,用于统一存放并有效管理集中后的客户数据、交易数据与行情数据,为开展数据挖掘作好准备。 2.1数据仓库/数据挖掘系统的构成 DC-CRM中完整的数据仓
4、库/数据挖掘系统的结构,主要由以下6个模块构成: ·数据获取引擎:DC-CRM中,数据仓库的数据源包括多个方面,见表1所示。表1DC-CRM中数据仓库的数据源 数据获取引擎的任务,就是按知识库中规则的要求,从多个导构的数据源中提取构建数据仓库所需的内容,并对其进行转换、清洗等预处理工作,再将预处理后的数据导入数据仓库进行存储; ·数据仓库模块:设立事实表和维表,有效存储并管理由数据获取模块获取,并经预处理后的多维数据,供挖掘引擎使用; ·知识库模块:用于存储并有效管理以下内容:(1)经挖掘引擎产生的、并经过评估模块确认的知识,(2)用于
5、指导数据仓库/数据挖掘系统有效工作的控制规则,(3)数据仓库的元数据; ·挖掘引擎模块:在规则的指导下,综合运用多种数据挖掘工具,对数据仓库的内容进行综合分析和深度挖掘,提取出有用的模式,并提交评估模块进行评估; ·系统维护模块:对整个数据仓库/数据挖掘系统进行维护,对控制规则进行手工维护和调整,对数据挖掘引擎产生的知识进行评估,并在数据仓库内容更新后对原有的知识进行重新评估; ·结果揭示/用户界面:为系统用户提供友好的操作界面,和挖掘结果揭示工具。 DC-CRM中数据仓库/数据挖掘系统的总体结构见图1所示。图1数据仓库l数据挖掘系统的
6、结构 2.2多维数据库的设计 数据库依照共享维度的星型模型而建立,其中包含了2个事实表和5个维表,事实表分别记录了客户的资金变动(成交、存取款)情况(t_fund)和大盘变动情况(t_total),维表分别记录了客户信息(t_client)、日期(t_date)、客户类别(t_type)、委托信息(t_order)、以及证券基本资料(t_stock)等方面的信息。这样,数据库中存储的多维数据就基本涵盖了DC-CRM所关心的所有信息内容。 多维数据的星形模型结构见图2所示。图2多维数据的星形模型3数据获取处理的要点 和一般的数据仓库不同,
7、DC-CRM系统数据仓库的数据获取和预处理工作比较复杂,这主要表现在:(1)数据来源的多重性与复杂性;(2)源数据格式的多样性;(3)部分源数据需要解密;(4)有些源数据是非结构化的,需要采用专门的信息处理技术进行结构化处理。因此,本系统的数据获取与预处理过程,需要采用专门的数据获取引擎来实现,而处理引擎的运作依据,是置于知识库模块中的控制规则。控制规则相对固定,并由专门人员通过系统维护模块进行维护。 下面着重说明三类数据的获取与预处理。 3.1客户资料的清洗 交易系统中,设有记录客户资料的表。由于历史的原因,这些表内容的完整性和真实性并不
8、理想,存在着大量的空缺值和噪声数据,必需在导入数据仓库之前予以清洗。数据获取引擎对该类数据的清
此文档下载收益归作者所有