谈模型技术之代理键使用的深入理解

谈模型技术之代理键使用的深入理解

ID:28512948

大小:88.87 KB

页数:26页

时间:2018-12-10

谈模型技术之代理键使用的深入理解_第1页
谈模型技术之代理键使用的深入理解_第2页
谈模型技术之代理键使用的深入理解_第3页
谈模型技术之代理键使用的深入理解_第4页
谈模型技术之代理键使用的深入理解_第5页
资源描述:

《谈模型技术之代理键使用的深入理解》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谈模型技术之代理键使用的深入理解从第一次使用代理键技术开始,就去深入总结了很多代理键在各个方面的功能,结合Kimball资料中的介绍,就理解得更多了。首先代理键的基本理解,应该是对维度ID的一个代用Key值,一定是数字字符型,最根本不可替代的作用,就是能反映维的变化,如果你不使用代理键,那么就得用维ID结合变化时间去描述,这样在DVV的ETL过程中,效率会非常慢,而且和事实表关联后,事实表就会有N多时间标志字段,到后来就是乱七八糟的模型了。所以从这个角度来看,代理键在数据库仓库模型中,是必须用的技术。其次代理键既然是代理,那么注定了它只能在DVV存储中使用,在源、展现中,都和它无关,它说白

2、了就是信息管道,变化前初始信息请走管道0通道、变化1请走管道1号通道。达到目的展现后,它的任务完成了,最终用户是感觉不到它的身影的。再数据仓库模型高级技术中,它也是重要角色,无论你想保留并跟踪维历史定义的变化,还是保留和跟踪维层次的变化,几乎所有相关变化都可以用代理键去处理。代理键升华后,你可以无限创新下去,反正多数维的数据量有限,你可以无限地跟踪各种变化,效果真是爽啊,而且这种架构会使你在变化中坚固屹立不倒谈模型技术之代理键使用的深入理解从第一次使用代理键技术开始,就去深入总结了很多代理键在各个方面的功能,结合Kimball资料中的介绍,就理解得更多了。首先代理键的基本理解,应该是对维度

3、ID的一个代用Key值,一定是数字字符型,最根本不可替代的作用,就是能反映维的变化,如果你不使用代理键,那么就得用维ID结合变化时间去描述,这样在DVV的ETL过程中,效率会非常慢,而且和事实表关联后,事实表就会有N多时间标志字段,到后来就是乱七八糟的模型了。所以从这个角度来看,代理键在数据库仓库模型中,是必须用的技术。其次代理键既然是代理,那么注定了它只能在DVV存储中使用,在源、展现中,都和它无关,它说白了就是信息管道,变化前初始信息请走管道0通道、变化1请走管道1号通道。达到目的展现后,它的任务完成了,最终用户是感觉不到它的身影的。再数据仓库模型高级技术中,它也是重要角色,无论你想保

4、留并跟踪维历史定义的变化,还是保留和跟踪维层次的变化,几乎所有相关变化都可以用代理键去处理。代理键升华后,你可以无限创新下去,反正多数维的数据量有限,你可以无限地跟踪各种变化,效果真是爽啊,而且这种架构会使你在变化中坚固屹立不倒成为主动解决业务问题的模型技术典范。在原来谈架构的时候,谈到内部架构的紧偶合,就是说这样的关系,维表和事实表息息相关。当维表有变化时,代理键必定会更新,而每个周期的事实表对应的维,也需要根据具体情况去关联ETL,他们才能完整的形成一个信息整体。适应变化的技术也得整体考虑,否则会顾前就顾不了尾。所以这才是必须先维表后事实表的根本原因,而在展现的时候,由于事实表和维表是

5、在统一的代理键下工作的,可以放心关联使用。同时还得考虑多周期和历史信息表,相信多数大型DW项目中都会将当前事实表按照周期分开为前端服务,同时也会因为效率原因,将近时期数据和中远时期数据分幵物理存储。因此在ETL过程中,这些ETL流程都要理顺,历史表也不能遗漏。而在最新的模型技术中,会有辅助模型和参考模型的高级技术,他们的初衷无非是更好地服务“变化”二字,特别是复杂的企业信息架构,不定期、不定维、不定势地变化起来,真的很恐怖,一般架构难以长期维持。这个时候代理键技术仍然是这些高级建模技术的基础,有了代理键,你可以将维表和参考模型/辅助模型关联起来,而又因为维表和事实表关联,所以整个架构就显得

6、紧凑而坚在有的项目中,DW模型以雪花型为主,这样存储方便,逻辑紧凑,而数据集市为了展现可能会演变成纯星型模型,这当中的转变,一定要小心,必须也是先考虑维表,再考虑事实表,代理键也是他们的重要桥梁,不要搞乱桥梁了。大家如果好几年前就做过DW项目的话,可能做过没有代理键的模型架构,刚开始还觉得很不错,没多久维护量就猛增,有体会的,现在不防假设下你不用代理键设计DW,后果会怎样?这里说的是建模技术,代理键只是其中重要的一个组成部分,它和其他思想组成建模技术。说到逻辑技术,往往做物理技术的觉得这不算什么技术,其实象ERP这些不也是一个逻辑技术么?ERP最核心的技术我想并不是它到底使用C++技术架构

7、还是JAVA或其他技术架构,而是ERP体系的逻辑,这才是最核心的,ERP厂商的技术架构可能会选择换,但它的核心逻辑永远是循序渐进,不会大改大换的。还有,非专业人士不要老认为代理键==主键。维度模型中,维表的代理键一般就是主键,而事实表中,代理键的组合才能形成主键,他们同时也是维表的外键。而汇总事实表中还可能有一些非主键的代理键,他们的目的也许是为了展现方便同样的数据库的一个概念,在数据仓库的应用就有独特的需求和业务背景,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。