提高数据仓库中数据质量的研究论文

提高数据仓库中数据质量的研究论文

ID:6195819

大小:2.04 MB

页数:45页

时间:2018-01-06

提高数据仓库中数据质量的研究论文_第1页
提高数据仓库中数据质量的研究论文_第2页
提高数据仓库中数据质量的研究论文_第3页
提高数据仓库中数据质量的研究论文_第4页
提高数据仓库中数据质量的研究论文_第5页
资源描述:

《提高数据仓库中数据质量的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、提高数据仓库中数据质量的研究毕业论文目录1绪言21.1课题背景21.2国内外发展概况21.3本章小结42数据仓库52.1数据仓库(DataWarehouse,DW)52.2数据仓库应用的作用和意义72.3本章小节103数据仓库中的ETL及EMC中ETL的应用113.1数据仓库中的ETL113.1.1ETL简介113.1.2ETL过程的特点113.1.3数据质量保证123.1.4元数据:拓展新型应用133.2实例概述143.3总体流程153.4接口表163.5企业数据迁移(EDM)模型层173.6事实表层183.7数据集市(DM)层183.8多维分析(OLAP)层18

2、3.9总体处理流程、反馈过程19413.10本章小结204EMC中数据调度校验的应用214.1需求分析214.1.1需求设计描述214.1.2功能性需求描述(按功能模块进行说明)214.1.3非功能性需求描述224.2系统总体设计234.2.1系统总体功能设计图234.2.2系统总体功能设计图说明234.2.3系统功能设计描述244.3概要设计254.3.1概要功能设计图254.3.2功能性描述(按功能模块)264.4后台调度流程284.4.1ETL任务调度概述284.4.2任务/任务组实例化284.4.3任务实例调度294.5后台校验流程304.5.1功能304.

3、5.2数据结构304.5.3流程314.5.4重要函数344.6本章小结435效果说明和总结44致谢45参考文献46附录A47411..绪论11.1研究背景11.2国内外研究现状21.3本文的主要研究内容和内容组织32..数据仓库以及ETL42.1数据仓库(DataWareHouse,DW)42.2ETL(Extract,Transform,loading)62.2.1ETL简介62.2.2ETL过程特点72.2.3数据质量保证82.2.4元数据:拓展新星应用93..EMC项目中的ETL应用103.1业务背景103.2实例概述123.3总体流程133.4接口表143

4、.4企业数据迁移((EDM))模型层153.5事实表层163.6数据集市(DM)层173.7多维分析(OLAP)层173.8总体处理流程、反馈过程174..EMC中数据调度校验的应用194.1需求分析194.1.1需求设计描述194.1.2功能性需求描述(按功能模块进行说明)194.1.3非功能性需求描述204.2系统总体设计214.2.1系统总体功能设计图21414.2.2系统总体功能设计图说明214.2.3系统功能设计描述224.3概要设计234.3.1概要功能设计图234.3.2功能性描述(按功能模块)244.4后台调度流程264.4.1ETL任务调度概述26

5、4.4.2任务/任务组实例化274.4.3任务实例调度284.5后台校验流程294.5.1功能294.5.2数据结构294.5.3流程294.5.4重要函数325..效果说明和总结42致谢43参考文献44411..绪论1.1研究背景随着全球经济一体化进程的推进以及我国的经济快速增长,大多数行业的市场竞争激烈加剧。这对企业管理和经营决策的制定的时效性、科学性、准确性提出了很高的要求。只有以数据为基础,从基于经验的分析到基于准确事实的洞察,才能有效保证企业服务质量、营销成功率和管理水平,节约企业营销成本,最终使企业利润和客户满意度的最大化。数据仓库正是在这种大环境下应运

6、而生了。随着我国电信体制改革的深化,行业垄断格局已被打破,国内通信市场形成了电信、移动、联通、网通、铁通等多元化竞争局面,竞争日趋激烈。电信运营商的经营理念也逐渐从“以产品为中心”转移到“以客户为中心”了。而面对客户的多样化、层次化、个性化的需求,大众化营销已经失去了其优势,基于客户信息、客户价值和行为,深入数据分析的洞察力营销、精确化营销的理念逐渐被各大电信运营商所接受。商务活动的主动权被交到了客户手中,而保持原有的客户对电信公司来说变的至关重要。在过去多年中电信行业建立了计费帐务系统、综合结算系统、97系统、10000号系统、大客户系统等多种业务支撑系统,然而各

7、个系统相对独立,数据分散不一致。这就产生了数据依赖系统存在、缺少完整统一的客户视图、数据共享缺少统一的标准共享困难、数据对闭环的业务流程支撑程度较弱等问题。基于此现状,电信公司确定整合客户数据并以客户为中心实行统一视图的目标,那么建设本企业的数据仓库就势在必行了,而同时保证数据仓库中数据的质量的有效性就成为了一个重点研究的问题。科学决策是现代企业的管理的核心与基础,但高质量的数据是正确决策的前提。要提供有质量保证数据,数据的抽取、转换和装载过程特别是转换过程相当重要。针对电信业务种类多,业务更新快,数据来源广的特点,ETL过程就变得充满挑战性。庆幸的是,已经有很

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。