greenplum使用手册

greenplum使用手册

ID:11077114

大小:996.29 KB

页数:68页

时间:2018-07-09

greenplum使用手册_第1页
greenplum使用手册_第2页
greenplum使用手册_第3页
greenplum使用手册_第4页
greenplum使用手册_第5页
资源描述:

《greenplum使用手册》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、GreenPlum数据库集群安装说明及使用手册开心十二月总结****年**月**日目录1体系结构介绍42安装102.1安装102.1.1安装准备102.1.2安装gp-db112.1.3配置通讯132.1.4建立数据存储池172.1.5同步系统时间172.1.6验证安装是否成功172.1.7初始化172.1.8数据库的启停182.2Master双机热备192.3Segment节点互备203GP数据库的使用223.1pgAdminIII工具223.1.1安装和第一次使用pgAdminIII223.1.2主窗体233.1.3导航菜单233

2、.1.4工具栏介绍243.1.5数据库与表的创建253.1.6使用pgAdminIII备份数据库253.2JDBC配置263.3GP数据库两个重要概念273.3.1什么是Schema273.3.2数据分布存储283.4GP的SQL语法283.4.1数据加载283.4.2SQL并行查询313.4.3聚合函数313.4.4索引313.4.5分区323.4.6函数344维护数据库384.1数据库启动gpstart384.2数据库停止gpstop404.3查看实例配置和状态404.4查看数据库运行状态gpstate404.5查看用户会话和提交

3、的查询等信息424.6查看数据库、表占用空间424.7查看数据分布情况424.8实例恢复gprecoverseg424.9查看锁信息434.10数据库的备份与恢复435调优、排错436附件436.1DBA常用命令437Q&A447.1不支持触发器447.2更新操作中的若干问题441体系结构介绍Greenplum数据库产品——下一代数据仓库引擎和分析方法Greenplum公司是企业数据云计算解决方案的创始人,为客户提供灵活的数据商业智能和分析方法。能够以极低的成本代价,提供业界领先的计算性能。客户遍及美国知名企业:Nasdaq、NYSE

4、、Ebay、FoxInteractiveMedia……等。Greenplum公司的Greenplum数据库产品是用于建造下一代数据仓库和巨大规模分析系统的软件解决方案。支持SQL和MapReduce并行处理,更适合管理TB级~PB级的海量数据,并以极低的成本代价提供了业界领先的计算性能。使用独有的sharing-nothingMPP架构,服务器的集群工作起来,就像是一个独立的超级计算机!优化了BI和分析方法,自动化分区数据和并行查询,比传统数据库执行速度提高10倍~100倍!Greenplum数据库的特色:Ø大规模地并行分析处理能力G

5、reenplum数据库可以跨越100~1000颗CPU,实现统一的并行操作引擎,让处理过程尽可能地靠近数据。Greenplum是业界最快的和最普及的高端数据仓库解决方案!用传统方式需花费数天才能完成的复杂查询,现在使用Greenplum只需要几分钟完成!Ø核心的MPP架构Greenplum数据库提供数据和查询的自动化并行:数据被自动分区跨越集群中的所有节点;查询以高度协作的方式,在集群的所有节点上执行。Ø高速PB级数据装载利用独有的MPPScatter/GatherStreaming技术,实现高速的数据装载。每增加1个节点,每小时装载

6、吞吐量提高4TB!Ø数据库内部压缩利用业界领先的压缩技术提高性能和降低存储空间。在有效较少1/3~1/10空间的同时,相应地提高了I/O性能。Ø多级容错能力Greenplum数据库利用多级冗余技术,在硬件或软件故障时,保障操作可以继续执行。Ø在线系统扩展为提高存储容量、处理性能,增加新的服务器到集群中,扩展的操作在后台完成,数据库可以继续保持正常工作状态不受影响。处理性能和存储容量,随服务器的个数增加成正比显著提高!Ø自有的MapReduce技术MapReduce是Google和Yahoo的大规模数据分析方法。Greenplum使用独

7、有的并行引擎执行MapReduce。Greenplum数据库架构原理解密:Greenplum数据库通过分布负载到多个服务器主机,实现操作存储和处理大规模的数据。数据库实际上由1个Master服务器和若干个独立的Segment服务器组成,一起协调工作,每个服务器都是独立的PostgreSQL数据库。如图1所示,Master服务器是数据库的入口,验证客户端,处理输入的SQL,分布工作到若干Segment服务器,统一协调各个Segment返回的结果,汇总最终结果返回客户端。Master不存储任何用户数据,只有全局系统视图。图1:Greenp

8、lum数据库架构如图2所示,Segment服务器是真正数据存储的地方,并承担主要的查询工作。用户数据(表、索引)被分布存储到有效的若干Segment,通过Hash算法,每个Segment存放数据的不同部分。图2:Segm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。