欢迎来到天天文库
浏览记录
ID:24104483
大小:51.00 KB
页数:4页
时间:2018-11-12
《eai-信息集成之数据建模》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、EAI:信息集成之数据建模
2、第1lun建模由于ERM可用于理解和简化商业领域和复杂系统环境中的模糊数据关系,因此它是一种抽取工具。图1显示了一个简单的ERM。ERM建模方法可使用以下两个基本概念产生特定兴趣领域的数据模型:实体实体之间的关系实体可定义为人、地点、事情,以及商业或组织的相关事件,例如“产品”,如图1所示。实体代表一类对象,它们是现实世界中可以按属性和特征进行观察和分类的一些事物。关系描述模型中各实体之间的结构性交互和关联显示了实体间的相关性。例如,图1中,箭头从“产品”指向“订单”。箭头每一端的数字定
3、义了关系的基数,本例中为1对n(或1对多)。另外信息集成中的数据建模通常采用3NF模型。因为这类模型最初是为最小化数据冗余而设计的,该模型在值发生改变时,可使数据库中的更新数量达到最小,这对降低维护复杂度是非常有价值的。维度建模维度建模是一种将数据模型概念化和形象化为一组可用一般商业概念描述的度量的技术。在总结和重新整理数据以及显示数据视图以支持数据分析时,该技术特别有用。维度建模主要处理数字数据,比如值、计数、重量和出现次数。维度模型包含的基本概念有:事实维度度量(变量)事实是相关数据项的集合,包含度量和环境数据
4、。每个事实一般代表商业项、商业事物或可以在商业或商业过程分析中使用的事件。维度是从特定角度描述事实数据的一组成员或单位。在图表中,维度通常是用轴来表示的。在维度模型中,事实表中的每个数据点都与多维中每个维度的一个成员相关联。维度决定了事实的环境背景。度量是事实的数字属性,表示商业相对于维度的性能和行为。其实际成员称为变量。例如,度量为销售额、销售量、供应量等等。度量由维度的成员组合来决定,并定位到事实中。维度建模的基本模型为如图2所示的星型模型。该模型通常有一个较大的中央表(事实表)和一组以放射状围绕在事实表周围的
5、较小的表(维度表)。确定建模技术根据的经验,在选择建模技术时,采用混合的方法比采用单纯的方法更好。如果使用得当,这两种方法都有好处这两种数据建模技术看上去有很大的不同,但它们也有很多相似之处。维度建模可以使用相同的符号,比如实体、关系、属性和主关键字。而且,通常可以说事实就是一个实体,其主关键字为外关键字的组合,而外关键字又引用维度。因此,可以说维度建模是ERM建模的一种特殊形式。但是,传统的ERM通过实体间复杂的关系来表现模型中的复杂关系,而维度模型主要面向分析优先使用哪种技术取决于目标数据库的目的,如果目标数据
6、库用作单纯的业务处理,则优先使用ERM技术。在业务处理中,我们通常只是对非常特殊的任务(这些任务一般由ERM的实体来表示)请求少量数据,并且需要来自源系统的非常快的数据。由于ERM中没有冗余数据或只有少量的冗余数据,因此可以从源系统或通过应用程序非常快地进行更新。能够快速更新的另一个原因是现有系统通常也是使用ERM设计的。因此在更新过程中的转换需要可能会非常小。如果目标数据库更多地用作数据访问系统,那么就优先使用维度建模方法。在这种情况下,在更新数据的过程中,可进行许多转换,并可安排数据以满足数据访问应用程序的需要
7、。虽然这也意味着更高的数据冗余,但也可使用于分析的复杂查询更快速地进行。以下是某烟厂的信息集成建模实例,维度建模的数据组织方式如图3所示:由图3可知,数据的组织方法是:1.按照生产单位,把制丝部分的数据分成机台、工序、生产线、班组、车间、全厂。卷接包部分分成机台、系统、区域、班组、车间、全厂。2.在每个生产单位的类别下,按照时间,分成批、班次、日、月、年。3.每个时间段内分别以计划调度类、产量统计类、设备管理类、物耗管理类、烟叶单耗类、工艺质量类等类别来组织数据。4.特定数据按照烟号、牌号进行细分。运用多维的方法分
8、析数据,为逻辑模型设计时采用各种结构建立多维数据库提供了方便,比如采用关系型或雪花型等等。
此文档下载收益归作者所有