欢迎来到天天文库
浏览记录
ID:29699441
大小:34.78 KB
页数:8页
时间:2018-12-22
《数据仓库中的数据质量探究---开题报告 相关附件》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、附件厦门大学软件学院《毕业设计(论文)》开题报告学生姓名班级学号指导教师姓名职称所在单位厦门大学软件学院毕业设计(论文)题目数据仓库中的数据质量探究毕业设计(论文)的目标:面向事务处理的强大信息系统(OLTP)已十分常见,它们使全球各地的企业拉开了档次,如果企业需要在行业中领先,他们就需要能够重新发现和应用现有信息的分析型系统(OLAP)。数据仓库就是一种面向分析的信息系统。数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(T
2、imeVariant)的数据集合,用于支持管理决策。随着计算机技术的发展,尤其是分布式技术的发展,数据仓库在我国有着广阔的发展空间和良好的发展前景。目前,数据仓库在我国广泛应用于银行业,电信业,并迅速向其他行业领域发展。在数据仓库的相关研究中,元数据(Metadata)和数据质量(DataQuality)是最重要的两个研究方向。其中,数据质量意味着数据的准确性、域完整性、数据类型、一致性、冗余性、完整性、符合商业规则、清晰、时效性、有用性以及符合数据完整性规则。数据质量也是数据仓库开发和使用过程中最大的挑战。数据质量低劣造成的损失包括企业错误的决定
3、,失去的商业机会,系统因为额外的数据清洗而带来的额外开销,冗余数据占用的资源,不一致的报表以及每次发现错误数据而进行修改所耗费的时间和精力等。本课题的目标在于对数据质量进行深入广泛的研究,在国内外数据质量研究成果的基础上,提出建设性的新观点新方法,并且结合实际案例提出可行的实施方案。实现方法:1.大量阅读国内外有关数据质量研究的文献(中英文文献各50篇左右)。2.在深刻理解研究文献的基础上,根据自己的理解提出新的观点或者解决方案。3.结合Oracle,SQLServer2008,Teradata,DB2等开发工具,提出上述新观点或解决方案在实际案例
4、中的应用。附件时间进度安排:第一阶段:2009年1月27日-2009年3月1日收集资料,阅读数据质量的中英文文献,确定具体研究的方向及内容。第二阶段:2009年3月2日-2009年3月5日征求导师意见,同时作出修正和改进。第三阶段:2009年3月6日-2007年4月6日进一步学习相关的知识,大量阅读文献,开始初步接触和熟悉市面上主流的数据仓库解决方案(例如Teradata解决方案)和数据质量工具。第四阶段:2009年4月7日-2009年4月20日概括总结对于数据质量的研究,适当提出自己的认识和看法。第五阶段:2009年4月21日-2009年5月11
5、日研究数据质量在实际案例中的具体实施。第六阶段:2009年5月12日-2009年6月1日撰写毕业论文,并在导师指导下不断改进和完善。第七阶段:2009年6月2日—2009年6月7日准备毕业答辩。指导教师审核意见:校内指导教师签名:2009年月日附件厦门大学软件学院《毕业设计(论文)》中期检查报告学生姓名班级学号校内指导教师姓名职称教授所在单位厦门大学软件学院毕业设计(论文)题目基于数据仓库的企业数据质量控制毕业设计(论文)的目标和主要任务:研究目标:确保基于数据仓库的企业数据质量是一项非常困难的工作,其原因来自于多个方面。首先,数据源的组成具有不确
6、定性。数据可能来自原始OLTP系统,外部系统,Excel电子表格甚至是纸制表格中。同时,数据质量问题经常被赋予低优先级。如同计算机安全问题一样,尽管保证数据质量得到了越来越广泛的关注和认可,但事实上几乎没有人把它列为高优先级的企业事务。另外,由于数据需要整合在一个特定的平台上(如数据仓库),那么就需要有大量的措施来处理数据间的不一致性。此外,如何为企业数据质量选择一个合适的级别也是一个棘手的问题。固然IT人员希望企业的所有数据在任何一种情况下都是完美的,但显然这不可能达到。“适于使用”意味着数据质量的合适级别依赖于特定的环境。当不同的用户有着不同需
7、求的时候,决定数据质量需求就变得十分困难。现今,数据质量相关的研究人员和从业者已经对数据质量进行了广泛而深入的研究,并且取得了可观的成果。然而,业界仍然缺少一套关于如何控制基于数据仓库的企业数据质量的完整而富有实践意义的方法学。本课题的研究目标是在以往研究成果的基础上,总结开发这样一套方法学,旨在为企业IT人员从基于数据仓库的企业数据质量的各个方面提供具有借鉴意义的指导。主要任务:1.熟练掌握数据仓库的各种相关知识;2.深入了解数据质量在数据源和数据仓库中的内涵,仔细钻研总体数据质量管理(TotalDataQualityManagement)方法学
8、;3.学习在TDQM各阶段可能会用到的数据质量领域相关技术;4.寻找实际数据进行案例分析;5.在能够对TDQM运用自如和充
此文档下载收益归作者所有