Greenplum数据库设计开发规范参考.doc

Greenplum数据库设计开发规范参考.doc

ID:55550417

大小:1.02 MB

页数:64页

时间:2020-05-16

Greenplum数据库设计开发规范参考.doc_第1页
Greenplum数据库设计开发规范参考.doc_第2页
Greenplum数据库设计开发规范参考.doc_第3页
Greenplum数据库设计开发规范参考.doc_第4页
Greenplum数据库设计开发规范参考.doc_第5页
资源描述:

《Greenplum数据库设计开发规范参考.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Greenplum数据库设计开发规范参考文档2016年7月目录GREENPLUM数据库设计开发规范1V1.511前言41.1文档目的41.2文档范围41.3预期读者41.4参考资料42开发规范检查项43GP与TD的差异关注点64系统级设计74.1用户设计74.1.1超级用户84.1.2公共查询用户84.1.3公共数据区用户84.1.4集市系统用户84.2数据库表空间设计94.3资源队列设计104.4系统级的维护工作114.4.1系统表的维护工作114.4.2各种库表的维护工作124.4.3投产前统一收集统计信息125命名规范126数据库对象设计规范136.1数据库对象数据量136.

2、2表创建规范136.3表设计146.3.1数据类型146.3.2数据分布166.3.3数据分区176.3.4数据表压缩216.3.5数据表行列存储226.4索引设计236.5视图设计256.6Sequence设计266.7其他数据库对象设计266.7.1Schema266.7.2函数266.7.3触发器276.7.4临时表277开发规范277.1GP查询优化器GPORCA的使用277.2SQL开发规范287.2.1基本要求287.2.2大小写287.2.3缩进和换行287.2.4WHERE条件297.2.5表连接307.2.6排序语句327.2.7运算符前后间隔337.2.8CAS

3、E语句编写337.2.9SQL语句注释347.2.10嵌套子查询367.2.11高效的SQL语句写法367.2.12开发建议417.3存储函数开发规范427.3.1编码规则427.3.2大小写规则447.3.3缩进与换行457.3.4事务管理规范467.4应用开发规范467.4.1禁止在模板中嵌套子查询477.4.2两表关联执行delete语句477.4.3Window函数注意问题477.4.4Window函数和聚合函数使用原则481前言1.1文档目的随着Greenplum数据库仓库平台应用逐步上线,为了保证Greenplum数据仓库系统平台的平稳运行,保证系统的可靠性、稳定性、可

4、维护性和高性能,特制定本开发规范,以规范基于Greenplum平台的应用开发,提高开发质量。1.2文档范围本规范主要包含Greenplum数据仓库平台应用开发的设计开发规范要求;适合于本行所有基于Greenplum数据仓库平台的应用开发。1.3预期读者Greenplum数据仓库平台应用的设计与开发人员;Greenplum数据仓库平台的系统管理人员和数据库管理员;Greenplum数据仓库平台的运行维护人员;1.4参考资料《GPDB43AdminGuide.pdf》《GPDB43BestPractices.pdf》1开发规范检查项本规范主要用于指导Greenplum数据库平台的开发,

5、通过规范要求提升开发质量。本规范所提出的观点都是基于Greenplum数据库产品的最佳实践。同样,作为系统或者项目的管理者,也可以通过该规范对开发质量进行审查和监督。本章节的检查列表,是帮助系统管理人员审查开发质量,关注重点检查项。检查项目列表:序号分类检查项描述1系统级是否有按照开发规范创建数据库角色:1、创建子系统专用的用户2、非超级用户3、ETL跑批用户与前端用户区分开2资源队列检查:数据库角色归属的资源队列是否符合规范,不允许使用默认队列pg_default3tablespace检查:1、是否安装规范要求创建独立的tablespace。2、表是否按照要求创建到该tables

6、pace中。3、检查相应的用户是否有配置默认tablespace4表属主检查:检查表的属主(owner)是否按照规范,表属主都应该是子系统的用户,一般属主应该是跑批用户(*_trans)。属主不允许是超级用户5库表设计检查子系统的中表数量6检查分区表设计是否符合规范1、如果表太大需要按天划分分区,只在半年内保留内的天分区;2、按月分区只在5年内保留月分区;3、五年前的历史分区都采用年分区;4、拉链表会有特殊的分区,如:p、p5、单个分区表,子分区数量不要超过300个。6、检查是否有没用的分区。是否有没用的子分区则需要结合具体的业务需求来定7检查是否需要设置为分区表,分区粒度是否合适

7、。按照生产环境判断分区粒度的规则:1、表的总记录数超过3亿,单表容量超过50GB,需要把表设计为分区表2、该表在每个实例上记录数小于50万的表,无需进行分区,根据生产环境上实例数计算表总记录数小于XXX条记录,不需要设置为分区表3、单个子分区的记录数小于1000万,说明分区粒度太细8检查默认分区是否有过多的数据记录9检查表压缩设计,统计各种压缩表的数量。如果表的记录数小于1000万,该表不需要设计为压缩表。10倾斜率检查11ETL任务automation中是否有配置子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。