一、通用命名规范

1、目前主流的命名方法大体分类:大驼峰命名法 (camelCase) 和小驼峰命名法 (snake_case),本规范要求使用小驼峰命名法 (snake_case),统一为小写字符,单词之间使用下划线隔开,贴源层字段可以不遵守,字段命名和源系统保持一致。

2、单词长度不超过 64 个字符,字段或者表命名小于 6 级

3、命名尽量做到见名知意,言简意赅,尽量使用英文以及符合业界要求的字符,特殊情况下可以使用汉语拼音缩写

4、尽量避免使用关键字,确实需要使用关键字情况下使用“`”转义

5、优先使用词根管理规范中已有的关键字,定期维护词根规范表

6、定期 review 新增命名使用的字段规范性

二、表命名规范

1、聚合粒度以及加工频率字段说明

3、数据表命名规范详解

其他字段相关说明

1、数据表 etl 时间字段统一使用 etl_time

2、标志类型的字段,是否类型的,统一使用 int 类型,取值统一使用 0/1,0 代表否,1 代表是,不允许出现空值域(如果有空值则新增取值 2,代表未知)

3、字段命名规范中未说明的部分参照通用命名规范

四、任务命名规范

任务是组成工作流的最小单位,也是完成一次 ETL 的最小开发单位,同时也是调度任务进行失败重试的最小单元。我们要求一个任务只写一张目标表,同时任务的命名中必须包含该目标表的表名。

本文文字及图片出自 InfoQ

余下全文(1/3)

本文最初发表在wkee.net,文章内容属作者个人观点,不代表本站立场。

分享这篇文章:

请关注我们:

《公司内部使用的数仓命名规范》有1个想法

  1. admin  这篇文章, 并对这篇文章的反应是俺的神呀赞一个

发表评论

邮箱地址不会被公开。 必填项已用*标注