好的数据库规范有助于减少软件实现的复杂度,降低沟通成本,本铁律主要涵盖了建库建表、建索引、写 SQL、ORM 映射等方面的处理约定。
1.建库铁律
–
|
铁律
|
Level
|
备注
|
字符集
|
使用 utf-8。如果存储的是表情则选用 utf8mb4 进行存储。
|
强制
|
|
排序规则
|
使用 utf8_general_ci
|
强制
|
2.建表铁律
–
|
铁律
|
Level
|
备注
|
|||||
注释
|
一定要有字段注释。
|
强制
|
||||||
编码
|
使用 utf-8。如果存储的是表情则选用 utf8mb4 进行存储。
|
强制
|
||||||
是否概念的字段
|
必须用 is_xx 命名,数据类型是 unsigned tinyint(1是0否)例如 is_deleted(1删除0未删除)。
|
强制
|
任何字段如果非负数必须unsigned
|
|||||
表名、字段名
|
只能使用小写字母、下划线或者数字;禁止以下划线或者数字开头;禁止两个下划线之间只出现数字;禁用保留字;表名禁止使用复数名词。
|
强制
|
||||||
库名、表名的命名
|
库名尽量与应用名称一致,表名最好用 业务名称_表的作用 命名。
|
强制
|
||||||
索引命名
|
主键索引用 pk_字段名;唯一索引用 uk_字段名;普通索引用 idx_字段名。
|
强制
|
pk_ 即 primary key;uk_即 unique key;idx_即 index
|
|||||
小数类型
|
数据类型是 decimal,禁止使用 float 和 double,float 和 double 存在精度损失,如果存储的数据范围超过 decimal 的范围,建议将数据拆成整数和小数并分开存储。
|
强制
|
||||||
varchar类型
|
varchar是可变长字符串,不预先分配存储空间,长度不要超过5000个字符,如果长度大于5000应用text(独立出一张表来,用主键来对应,避免影响其他字段的索引效率)。
|
强制
|
||||||
表名必备三字段
|
id(数据类型是 unsigned bigint,单表递增,步长为1),gmt_create、gmt_modified(主动创建时间、被动更新时间,数据类型都是 datetime)。
|
强制
|
||||||
字段冗余
|
字段允许适当冗余,但必须考虑数据一致,冗余字段应具备1)不频繁修改;2)不是varchar超长字段,更不能是text字段。
|
推荐
|
||||||
分库分表
|
单表行数超过500万行或者单表容量超过2GB时,才推荐分库分表。
|
推荐
|
设置合适的字符存储长度,不但可以节约数据库表空间和索引存储,更重要的是能够提升检索速度。
3.建索引铁律
–
|
铁律
|
Level
|
备注
|
唯一索引
|
业务上具有唯一特性的字段,即使是多个字段的组合,也必须建成唯一索引。虽然唯一索引影响了 insert 速度,这个损耗可以忽略,但是明显提高了查询速度;另外,即使在应用层做了非常完善的校验控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。
|
强制
|
|
join
|
超过三个表禁止 join,需要 join 的字段,数据类型必须一致;当多表关联查询时,保证被关联的字段需要有索引;即使双表 join 也要注意表索引、SQL 性能。
|
强制
|
|
varchar字段上建立索引
|
必须指定索引长度,没必要对全字段建立索引,根据实际文本区分度决定索引长度即可。索引长度与区分度是一对矛盾体,一般对字符串类型数据,长度为 20 的索引,区分度会高达 90% 以上,可以使用 countdistinct left列名, 索引长度))/count*) 的区分度来确定。
|
强制
|
|
页面搜索禁止模糊
|
页面搜索禁止左模糊或者全模糊,如果有需要请走搜索引擎来解决。禁止原因:索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。
|
强制
|
|
order by
|
如果有 order by 的场景,请注意索引的有序性。order by 最后的字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现 file_sort 的情况,影响查询性能。正例:where a=? and b=? order by c; 索引应建为 a_b_c;反例:索引中有范围查找,那么索引有序性无法利用,如 where a>10 order by b; 索引 a_b 无法排序。
|
推荐
|
4.写SQL铁律
–
|
铁律
|
Level
|
备注
|
count*)
|
不要使用 count列名) 或 count常量) 来替代 count*),count*) 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。count*) 会统计值为 NULL 的行,而 count列名) 不会统计此列为 NULL 的行。
|
强制
|
|
countdistinct col)
|
计算该列除 NULL 外的不重复行数。注意,countdistinct col1, col2),如果其中一列全为 NULL,那么即使另一列有不同的值,也返回为 0。
|
强制
|
|
sumcol)
|
当一列的值全为 NULL 时,countcol) 的返回结果为 0,但 sumcol) 的返回结果为 NULL,因此使用 sum) 时需要注意 NPE 问题。可用如下方式避免 NPE 问题:select ifisnullsumg)), 0, sumg)) from table;
|
强制
|
|
isnull
|
使用 isnull) 来判断是否为 NULL 值。NULL 与任何值的比较都为 NULL。
|
强制
|
|
分页查询逻辑
|
若 count 为 0 应直接返回,避免执行后面的分页语句。
|
强制
|
|
外键与级联
|
禁止使用外键与级联,一切外键概念必须在应用层解决。原因:外键与级联不适合分布式、高并发集群,级联更新是强阻塞,存在数据库更新风暴的风险,外键影响数据库的插入速度。
|
强制
|
|
存储过程
|
禁止使用存储过程,存储过程难以调试和扩展,更没有移植性。
|
强制
|
|
数据订正
|
数据订正(特别是删除、修改记录操作)时要先 select,避免出现误删除,确认无误后才能执行更新语句。
|
强制
|
|
in
|
in 操作能避免就避免,如果实在避免不了,in 后面的集合元素数量要控制在 1000 个以内。
|
推荐
|
|
truncate table
|
禁止使用 truncate table,truncate table 比 delete 速度快,且使用的系统和日志资源少,但是 truncate 无事务且不触发 trigger,有可能造成事故,故不要在开发代码中使用此语句。
|
参考
|
5.ORM映射铁律
–
|
铁律
|
Level
|
备注
|
表查询
|
禁止使用 * 作为查询的字段列表,需要哪些字段必须明确。
|
强制
|
|
POJO
|
POJO 类的布尔属性不能加 is,而数据库字段必须加 is,要求在 resultMap 中进行字段与属性之间的映射。
|
强制
|
|
返回参数
|
禁止用 resultClass 作为返回参数,即使所有类属性名与数据库字段一一对应,也需要定义;反过来,每一个表也必然有一个属性与之对应。原因:配置映射关系,使字段与 DO 类结耦,方便维护。
|
强制
|
|
返回参数
|
禁止直接使用 HashMap、HashTable 作为查询结果集的输出。原因:属性值的类型不可控。
|
强制
|
|
sql.xml 配置参数
|
sql.xml 配置参数使用 #{}, #param#,不要使用 ${},${} 容易出现SQL注入。
|
强制
|
|
queryForList
|
禁止使用 Mybatis 自带的 queryForListString statementName, int start, int size)。原因:其实现方式是在数据库取到 statementName 对应的 SQL 语句的所有记录,再通过 subList 取 start, size 的子集合。
|
强制
|
|
更新时间
|
更新数据库表记录时,必须同时更新记录对应的修改时间。
|
强制
|
|
更新数据库表记录
|
不要写一个大而全的数据更新接口(传入为 POJO 类)。执行 SQL 时,不要更新无改动的字段,原因:容易出错、效率低、增加 binlog 存储。
|
推荐
|
|
@Transactional
|
@Transactional 事务不要滥用。事务会影响数据库的 QPS。另外,使用事务的地方需要考虑各方面的回滚方案,包括缓存回滚、搜索引擎回滚、消息补偿、统计修正等。
|
参考
|
|
Mybatis 动态sql标签
|
< isEqual> 中的 compareValue 是与属性值对比的常量,一般是数字,表示相等时执行相应的 SQL 语句;< isNotEmpty> 表示不为空且不为 null 时执行;< isNotNull> 表示不为 null 时执行。
|
参考
|