资源描述:
《中文les08_选择数据仓库的计算架构_ 数据仓库教学课件 中文oracle99版》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、选择数据仓库的计算架构总述项目管理(方法论,维持元数据)定义数据仓库的概念及术语规划一个成功的数据仓库分析用户查询需求选择数据仓库的计算架构建模数据仓库规划仓库存储ETT(构建数据仓库)满足业务需求支持最终用户存取管理数据仓库目标在完成这一课后,你应该能够做到以下几点:讨论数据仓库的计算架构的需求考虑每个硬件架构的优点描述仓库环境需要的数据库服务器的特点回顾用于数据仓库环境的并行结构的重要性可测量性易管理性可用性可拓展性灵活性完整性架构的要求用户预算业务技术架构定义策略获取现有的架构的设计获取现有的能力方案验证现有的界面准备能力方案准备技术的架构验证操作系统的需求开发恢复方案开发
2、安全和控制方案创建架构创建技术风险评估硬件架构包括以下方面新技术旧技术网络硬件体系结构健壮的可用的可靠的可扩展的可升级的可支持的可恢复的并行的VLM(虚拟可加载模块)64位连接的开放的硬件架构SMP(对称多处理)Cluster(集群)MPP(大规模并行处理)NUMA(非一致内存访问)混合网络使用SMP和MPP评估标准决定你所需要的平台SMPClustersNUMAMPP可扩展性成熟度低高低高并行处理并行日常操作共享资源内存磁盘无,(什么都没有)松耦合还是紧耦合应用软件数据库操作系统硬件做出正确的选择不同操作系统的需求基准从供应商处可以买得到的开发自己的使用基于事实的查询重要的可扩展
3、性通过共享存储器通信磁盘控制器可访问所有中央处理器已成熟的技术SMP(对称多处理)共享磁盘公共路径CPU(中央处理器)CPUCPUCPU共享存储器SMP(对称多处理)优点:高并发负荷均衡中度的可扩展性易于管理局限:内存(聚族技术有所改进)带宽CPUCPUCPUCPUSharedmemory(共用存储器)NUMA(非一致的内存访问)不一致的内存访问Disk(磁盘)共享总线DiskSharedMemory(共享内存)CPUCPUCPUCPUCPUCPU松耦合的共享存储器SharedMemory(共享内存)NUMA(非一致内存访问)优点:可充分地升级,增量地加磁盘、加CPU和带宽有比MP
4、P更好性能与Oracle服务器匹配局限:技术较新,验证不充足对于简单的系统管理也需要新的工具NUMA比SMP价格更高Clusters(集群)节点1节点2节点3公共的高速总线共享磁盘公共的高速总线共享内存CPUCPUCPU共享内存CPUCPUCPU共享内存CPUCPUCPUClusters(集群)共享磁盘,松耦合专用内存高速总线共享资源SMP节点优点:高可用性单一的数据库概念,逐步地增长局限:可扩展性,需要节点间同步操作此系统的费用SharedmemoryCPUCPUCPUSharedmemoryCPUCPUCPUSharedmemoryCPUCPUCPUMPP(大规模并行处理系统)
5、CPUMemoryCPUMemoryCPUMemoryMemory(内存)CPU(中央处理器)Disk(磁盘)DiskDiskDiskMPP(大规模并行处理系统)无架构共享多节点快速访问各节点独占内存各节点低成本可升级的n-立方体的构造MPP的优点无限制的增量式增长优越的可升级性快速访问各节点低成本有益于DSSCPUMemoryCPUMemoryCPUMemoryMemoryCPUDiskDiskDiskDiskMPP的局限严格的分割高速缓存的一致性受限制的磁盘访问各节点的高内存成本高管理负担谨慎的数据安置CPUMemoryCPUMemoryCPUMemoryMemoryCPUDi
6、skDiskDiskDiskWindowsNT基于客户-服务器模型的体系架构优点:包括内在的网络服务可扩展性易于管理和控制局限:不十分安全不能执行远程的程序在四个处理器之外缺乏线性可扩展性用于应用的地址空间限制于2G字节多层的体系架构层次的结构:基于模块逻辑分离分布式结构:两层三层四层(或更多)中间件用于集成的技术网关数据库服务器的需求健壮的可用的可靠的可扩展的可升级的可支持的可恢复的并行的并行数据库查询加载索引排序备份恢复更进一步的考虑最优化的策略分割的策略概要的策略索引技术硬件和软件的可扩展性可用性管理服务器环境操作型服务器仓库服务器数据集市服务器开放的数据库管理系统网络,关系
7、型,分等级的大型机单独拥有的DBMSOracle,IMS,DB2,VSAM,Rdb,NonStopSQL,RMS开放的数据库管理系统关系型普通目的和仓库特征的DBMSOracle,Informix,Sybase,IBMDB2,NCR/AT&TTeradataRedBrick开放的数据库管理系统关系型,多维一般目的和仓库特征的DBMSOracle,OracleExpress,ArborEssbase,MSSQLServer,NT并行处理一个大任务分解成多个小