Greenplum数据库设计开发规范

Greenplum数据库设计开发规范

ID:43481715

大小:293.16 KB

页数:22页

时间:2019-10-07

Greenplum数据库设计开发规范_第1页
Greenplum数据库设计开发规范_第2页
Greenplum数据库设计开发规范_第3页
Greenplum数据库设计开发规范_第4页
Greenplum数据库设计开发规范_第5页
资源描述:

《Greenplum数据库设计开发规范》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、目录第一章前言21.1文档目的21.2预期读者21.3参考资料2第二章设计规范32.1数据库对象数量32.2表创建规范32.3表结构设计42.3.1字段命名42.3.2数据类型42.3.3数据分布52.3.4分区72.3.5压缩存储82.3.6索引设计92.4其他数据库对象设计102.4.1schema102.4.2视图112.4.3临时表和中间表11第三章SQL开发规范123.1基本要求123.2WHERE条件123.3分区字段使用133.4表关联133.5排序语句163.6嵌套子查询163.7UNION/UNIONALL16第

2、21页3.8高效SQL写法的建议18第21页第一章前言1.1文档目的随着Greenplum数据库的正式上线使用。为了保证Greenplum数据仓库系统平台的平稳运行,保证系统的可靠性、稳定性、可维护性和高性能。特制定本开发规范,以规范基于Greenplum数据库平台的相关应用开发,提高开发质量。1.2预期读者Greenplum数据仓库平台应用的设计与开发人员;Greenplum数据仓库平台的系统管理人员和数据库管理员;Greenplum数据仓库平台的运行维护人员;1.3参考资料参考Greenplum4.3.x版本官方指引:《GPD

3、B43AdminGuide.pdf》《GPDB43RefGuide.pdf》《GPDB43UtilityGuide.pdf》第21页第一章设计规范1.1数据库对象数量数据库对象类型包括数据表、视图、函数、序列、索引等等,在Greenplum数据库中,系统元数据同时保存在Master服务器和Segment服务器上,过多的数据库对象会造成系统元数据的膨胀,而过多的系统元数据造成系统运行逐步变慢;同时,类似数据库的备份、恢复、扩容等较大型的操作都导致效率变慢。因此,依据GreenplumDB产品的最佳时间,单个数据库的对象数量,应控制在

4、10万以内。GP数据库的对象包括:表、视图、索引、分区子表、外部表等。如果数据表的数量太多,建议按应用域进行分库,尽量将单个数据库的表数量控制在10万以内,可以在一个集群中创建多个数据库。【备注】:在Greenplum数据库中,一张分区表,在数据库中存储为一张父表、每张分区子表都是一张独立的库表;例如:一张按月进行分区的存储一年数据的表,如果含默认分区,共14张表。1.2表创建规范为了避免数据库表数量太多,避免单个数据表的数据量过大,给系统的运行和使用带来困难,在Greenplum数据库中需遵循如下的表创建规范:1、GP系统表中保

5、存的表名称都是以小写保存。通常SQL语句中表名对大小写不敏感。但不允许在建表语句中使用双引号(“”)包括表名,这样会影响系统表中存储的名称,使得表名存在大小写或特殊字符。表命名也不允许出现中文字。2、单个数据库的数据表数量建议不要超过10万张;3、禁止使用二级分区表,因为二级分区表会造成表对象数量的急剧膨胀;4、由于过多的数据文件会导致操作系统对文件的操作效率降低,直接影响第21页到数据库的管理效率。如果数据文件数量过多,建议增加多个表空间,把数据表均匀分布到不同的表空间。每个表空间目录下的数据文件数量,应控制在80万以内。文件数

6、统计可以直接到某个Segment实例目录下指定的表空间目录下统计。5、创建数据表(DDL)的时候(不含临时表和程序中使用的中间表),必须使用tablespace子句指定用于存储的表空间,而不是把所有表都存储在默认表空间;例如:Createtableemployee(idint,namevarchar)TABLESPACEtpc_data_01distributedby(id);6、对于数据量超过1TB的大表,需从应用设计方面,考虑对大表进行优化,例如是否可划分为历史数据表和当前数据表,并分开存放;是否应采用压缩存储节省空间;是否合

7、理分区;是否应定期清理数据等等。1.1表结构设计1.1.1字段命名表字段的命名,与表名类似。在GP系统表中保存的表名称都是以小写保存。通常SQL语句中字段名称对大小写不敏感。但不允许在建表语句中使用双引号(“”)包括字段名,这样会影响系统表中存储的名称,使得表名存在大小写或特殊字符。字段命名也不允许出现中文字。1.1.2数据类型数据类型的定义与相关数据的加载和使用紧密相关,数据类型的定义决定了数据所占用的空间大小,因此,必须慎重设计GP数据仓库数据表的字段类型。数据仓库的数据来自于多个异构的业务应用系统,通常情况下,业务应用系统的

8、字段类型选择较为随意,不同的业务系统数据类型定义存在多样化,彼此之间差异较大;因此,在数据仓库中,需在参考源系统字段类型定义的情况下,结合Greenplum数据仓库平台的特点和要求,对字段数据类型进行设计。第21页Greenplum数据库的数据类型

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。