利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196

利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196

ID:11650342

大小:55.00 KB

页数:16页

时间:2018-07-13

利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196_第1页
利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196_第2页
利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196_第3页
利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196_第4页
利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196_第5页
资源描述:

《利用数据仓库/数据挖掘技术构建dc-crm模型_crm_管理信息化_196》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、利用数据仓库/数据挖掘技术构建DC-CRM模型_CRM_管理信息化1引言   随着“集中交易”在证券行业的逐步普及,交易数据的集中程度也日益提高。目前,在中等规模的集中交易系统中,股东开户数一般为10的五次方量级,而在规模较大的系统中,这一数字可高达1的六次方量级,交易记录数更是十分惊人。传统CRM系统的开发条件与工作环境与现实情况间的差距不断增大,在处理速度、功能种类、分析深度等方面,均难以满足实际工作的需要。因此,构造适应证券业数据集中环境的CRM系统的需求就显得十分迫切。   作为信息科学的一个重要研究领域,数据仓库和数据挖掘技术是数据库技术发展

2、到一定程度的产物。按Inmon的定义,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。而在数据仓库基础上的所谓数据挖掘,亦称数据库中的知识发现,就是在海量数据中探索数据间的关系、并从中提取有效的、新颖的、有潜在价值的知识和规律的过程。数据仓库与数据挖掘技术的结合,不仅能提高数据仓库对决策的支持能力,也能大大提高数据挖掘的工作效率。本文借助数据仓库/数据挖掘技术,设计了一个证券业数据集中环境下的CRM系统模型:DC-CRM(DataConcentriltedClientRelationshipManagement)

3、和传统CRM系统相比,DC-CRM模型具有以下特点:   ·数据来源更广泛:除客户资料外,还包括交易、行情和证券基本资料等方面的数据;   ·系统运行更高效:借助数据仓库技术,可以高效管理海量的数据内容;   ·揭示隐藏的知识:运用数据挖掘技术,能揭示隐藏在数据背后的知识,对实际工作具有更强的指导意义。2DC-CRM中数据仓库的构建   DC-CRM的核心部分,就是针对数据集中环境而设计的数据仓库,用于统一存放并有效管理集中后的客户数据、交易数据与行情数据,为开展数据挖掘作好准备。   2.1数据仓库/数据挖掘系统的构成   DC-CRM中完整的数据仓

4、库/数据挖掘系统的结构,主要由以下6个模块构成:   ·数据获取引擎:DC-CRM中,数据仓库的数据源包括多个方面,见表1所示。表1DC-CRM中数据仓库的数据源   数据获取引擎的任务,就是按知识库中规则的要求,从多个导构的数据源中提取构建数据仓库所需的内容,并对其进行转换、清洗等预处理工作,再将预处理后的数据导入数据仓库进行存储;   ·数据仓库模块:设立事实表和维表,有效存储并管理由数据获取模块获取,并经预处理后的多维数据,供挖掘引擎使用;   ·知识库模块:用于存储并有效管理以下内容:(1)经挖掘引擎产生的、并经过评估模块确认的知识,(2)用于

5、指导数据仓库/数据挖掘系统有效工作的控制规则,(3)数据仓库的元数据;   ·挖掘引擎模块:在规则的指导下,综合运用多种数据挖掘工具,对数据仓库的内容进行综合分析和深度挖掘,提取出有用的模式,并提交评估模块进行评估;   ·系统维护模块:对整个数据仓库/数据挖掘系统进行维护,对控制规则进行手工维护和调整,对数据挖掘引擎产生的知识进行评估,并在数据仓库内容更新后对原有的知识进行重新评估;   ·结果揭示/用户界面:为系统用户提供友好的操作界面,和挖掘结果揭示工具。   DC-CRM中数据仓库/数据挖掘系统的总体结构见图1所示。图1数据仓库l数据挖掘系统的

6、结构   2.2多维数据库的设计   数据库依照共享维度的星型模型而建立,其中包含了2个事实表和5个维表,事实表分别记录了客户的资金变动(成交、存取款)情况(t_fund)和大盘变动情况(t_total),维表分别记录了客户信息(t_client)、日期(t_date)、客户类别(t_type)、委托信息(t_order)、以及证券基本资料(t_stock)等方面的信息。这样,数据库中存储的多维数据就基本涵盖了DC-CRM所关心的所有信息内容。   多维数据的星形模型结构见图2所示。图2多维数据的星形模型3数据获取处理的要点   和一般的数据仓库不同,

7、DC-CRM系统数据仓库的数据获取和预处理工作比较复杂,这主要表现在:(1)数据来源的多重性与复杂性;(2)源数据格式的多样性;(3)部分源数据需要解密;(4)有些源数据是非结构化的,需要采用专门的信息处理技术进行结构化处理。因此,本系统的数据获取与预处理过程,需要采用专门的数据获取引擎来实现,而处理引擎的运作依据,是置于知识库模块中的控制规则。控制规则相对固定,并由专门人员通过系统维护模块进行维护。   下面着重说明三类数据的获取与预处理。   3.1客户资料的清洗   交易系统中,设有记录客户资料的表。由于历史的原因,这些表内容的完整性和真实性并不

8、理想,存在着大量的空缺值和噪声数据,必需在导入数据仓库之前予以清洗。数据获取引擎对该类数据的清

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。