From ee1f6e46bb090e9d039e8e28c1681a40637cf596 Mon Sep 17 00:00:00 2001 From: qiurunze123 Date: Sun, 13 Jan 2019 11:48:26 +0800 Subject: [PATCH] =?UTF-8?q?=E6=8F=90=E4=BA=A4mysql?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 5 +++ docs/mysql.md | 118 ++++++++++++++++++++++++++++++++++++++++++++++++++ 2 files changed, 123 insertions(+) diff --git a/README.md b/README.md index c7b9a63..024b603 100644 --- a/README.md +++ b/README.md @@ -87,6 +87,11 @@ #### [通信mq-Kafka--未更新](/docs/redis-code.md) #### [微服务框架--未更新](/docs/redis-code.md) #### [mysql数据库优化及架构学习](/docs/mysql.md) +#### [mysql数据库设计规范](/docs/mysql.md) +#### [mysql数据库设计实例](/docs/mysql.md) +#### [mysql数据库执行计划分析](/docs/mysql.md) +#### [mysql数据库备份和恢复](/docs/mysql.md) +#### [mysql数据库架构变迁](/docs/mysql.md) #### [netty专题(已更新 by liuxiangyu)](/docs/netty.md) #### [linux专题](/docs/linux.md) #### [面试专题(最后更新)--未更新](/docs/code-solve.md) diff --git a/docs/mysql.md b/docs/mysql.md index 2fa89f3..ca179cb 100644 --- a/docs/mysql.md +++ b/docs/mysql.md @@ -100,6 +100,124 @@ 6.尽量使用外键 不建议使用外检约束,但是一定要在表与表之间的关联键上建立索引 + 数据库字段设计规范 + + 1.优先选择符合存储需要的最小的数据类型 + 1.将字符串转换成数字类型存储 INET_ATON('255.255.255.255') = 4294967295 字符串转ip + 将字符串转换成数字类型存储 INET_NTOA('4294967295') = 255.255.255.255 ip 转字符串 + 2.对于非负数据采用无符号整形进行存储 signed int -2147483648 -- 2147483647 + unsigned int -0 -- 4294967295 + 3.VARCHAR(N)中的N代表的是字符数而不是字节数 使用UTF-8存储汉字varchar(255) = 765个字节 存储255个汉字 + 4.过大的长度会消耗更多的内存 varchar是一个可变的长度 + 2.避免使用text,blob数据类型 建议blob或者时text分离到单独的表中 + 避免使用enum数据类型 + 3.尽可能的所有列都定义为NOT NULL + 索引null列需要额外的空间来保存,所以需要占用更多的空间 + 进行比较和计算的时候要对null值进行特别的处理 + 4.字符串存储日期型的数据不是正确的 + 无法用日期函数来进行计算和比较 + 用字符串存储日期要占用更多的空间 + 5.timestamp 和datatime 类型存储时间 + timestamp 存储范围有限制 1970-01-01 00:00:01 ~2038-01-19 03:14:07 + timestamp占用4字节和INT相同,但是INT可读性能高 + 6.财务相关的金额类数据,必须由decimal类型存储 + decimal类型为精准的浮点数,在计算时不会丢失精度 + 占用空间由定义的宽度来决定 + 可用于存储比bigint更大的整数类型 + + 数据库sql开发规范 + + 1.建议使用预编译语句对数据库进行操作 + + 2.避免数据类型的隐式转换 不同表的相同列的数据类型不一致 会导致索引失效 + + 3.重复利用已经存在的索引 + 1.避免使用双%%的查询条件 如 a like '%1323%' + 2.一个sql只能利用到复合索引中的一列进行范围查询 + 有 a,b,c列的联合索引,在查询条件中有a列的范围查询,则在b,c列上的索引将不会被用到, + 在定义联合索引时,如果a列要用到范围查找的话,就要把a列放到联合索引的右侧 + 3.使用left join 或者not exists 来优化not in(偶尔也会导致索引失效) 操作 + + 4.程序链接不同数据库要使用不同的账号,禁止跨库连接为迁移和分库分表做预备 + + 5.禁止select * 必须使用select <字段列表> (* 无法覆盖索引 减少表结构变更 对程序带来的影响) + + 6.insert 明确字段列表 + + 7.禁止使用子查询,可以把子查询优化为join操作 + 子查询结果集无法使用索引 + 子查询会产生临时表操作,如果子查询数据量大则会更严重 + + 8.避免使用过多的join 关联表 + 于Mysql来说,是存在关联缓存的,缓存的大小可以由join_buffer_size参数进行设置 + 在Mysql中,对于同一个SQL多关联(join)一个表,就会多分配一个关联缓存,如果在一个SQL中关联的表越多, + 所占用的内存也就越大 + 如果程序中大量的使用了多表关联的操作,同时join_buffer_size设置的也不合理的情况下,就容易造成服务器内存溢出的情况, + 就会影响到服务器数据库性能的稳定性 + 同时对于关联操作来说,会产生临时表操作,影响查询效率 + Mysql最多允许关联61个表,建议不超过5个 + + 9.减少同数据库的交互次数 多个相同的操作合并在一起 + + 10.对应同一列进行or判断时,使用in代替or + + in 的值不要超过500个 + in 操作可以更有效的利用索引,or大多数情况下很少能利用到索引 + + 11.禁止order by rand() 进行随机排序 + + 会把表中所有符合条件的数据装载到内存中,然后在内存中对所有数据根据随机生成的值进行排序 + 并且可能会对每一行都生成一个随机值,如果满足条件的数据集非常大,就会消耗大量的CPU和IO及内存资源 + 推荐在程序中获取一个随机值,然后从数据库中获取数据的方式 + + 12.where 从句禁止对列进行函数转换和计算(导致无法使用相关列的索引) + + SELECT(错误写法) + * + FROM + miaosha_message + WHERE + create_time >= '20190101' + AND create_time < '20190102' + + SELECT (正确写法) + * + FROM + miaosha_message + WHERE + date + (create_time) = '20190101' + + 13.不会有重复值时使用UNION ALL 而不是UNION + UNION 会把两个结果集的所有数据放到临时表中后再进行去重操作 + UNION ALL 不会再对结果集进行去重操作 + + 14.拆分大sql变为小sql + 大SQL:逻辑上比较复杂,需要占用大量CPU进行计算的SQL + MySQL 一个SQL只能使用一个CPU进行计算 + SQL拆分后可以通过并行执行来提高处理效率 + + + 数据库操作行为规范 + + 过大数据的(100万)批量写操作要分批多次操作 + 1.大批量操作可能会导致严重的主从延迟 + 2. binlog日志为row格式时会产生大量的日志 + 大批量写操作会产生大量日志,特别是对于row格式二进制数据而言,由于在row格式中会记录每一行数据的修改,我们一次修改的数据越多, + 产生的日志量也就会越多,日志的传输和恢复所需要的时间也就越长,这也是造成主从延迟的一个原因 + 3. 避免产生大事务操作 + 大批量修改数据,一定是在一个事务中进行的,这就会造成表中大批量数据进行锁定,从而导致大量的阻塞,阻塞会对MySQL的性能产生非常大的影响 + 特别是长时间的阻塞会占满所有数据库的可用连接,这会使生产环境中的其他应用无法连接到数据库,因此一定要注意大批量写操作要进行分批 + 4.对于大表的修改使用pt-online-schema-change + 1.原理: 会在原表的结构上建造一个新表 复制数据 + 2.避免延迟,修改时锁表 + 5.禁止super权限滥用 + 6.数据账号连接最小 + + + + + \ No newline at end of file -- GitLab