分区表场景下的 SQL 优化

更新时间：2020年08月18日 10:08:43 作者：叶金荣

这篇文章主要介绍了分区表场景下的 SQL 优化，帮助大家更好的理解和学习SQL，感兴趣的朋友可以了解下

导读

有个表做了分区，每天一个分区。

该表上有个查询，经常只查询表中某一天数据，但每次都几乎要扫描整个分区的所有数据，有什么办法进行优化吗？

待优化场景

有一个大表，每天产生的数据量约100万，所以就采用表分区方案，每天一个分区。

下面是该表的DDL：

CREATE TABLE `t1` (
 `id` bigint(20) NOT NULL AUTO_INCREMENT,
 `date` date NOT NULL,
 `kid` int(11) DEFAULT '0',
 `uid` int(11) NOT NULL,
 `iid` int(11) DEFAULT '0',
 `icnt` int(8) DEFAULT '0',
 `tst` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
 `countp` smallint(11) DEFAULT '1',
 `isr` int(2) NOT NULL DEFAULT '0',
 `clv` int(5) NOT NULL DEFAULT '1'，
 PRIMARY KEY (`id`,`date`),
 UNIQUE KEY `date` (`date`,`uid`,`iid`),
 KEY `date_2` (`date`,`kid`)
) ENGINE=InnoDB AUTO_INCREMENT=3180686682 DEFAULT CHARSET=utf8mb4
/*!50500 PARTITION BY RANGE COLUMNS(`date`)
(PARTITION p20161201 VALUES LESS THAN ('2016-12-02') ENGINE = InnoDB,
 PARTITION p20161202 VALUES LESS THAN ('2016-12-03') ENGINE = InnoDB,
 PARTITION p20161203 VALUES LESS THAN ('2016-12-04') ENGINE = InnoDB,

该表上经常发生下面的慢查询：

SELECT ... FROM `t1` WHERE `date` = '2017-04-01' AND `icnt` > 300 AND `id` = '801301';

SQL优化之路

SQL优化思路

想要优化一个SQL，一般来说就是先看执行计划，观察是否尽可能用到索引，同时要关注预计扫描的行数，以及是否产生了临时表（Using temporary）或者是否需要进行排序（Using filesort），想办法消除这些情况。

更进一步的优化策略则可能需要调整程序代码逻辑，甚至技术架构或者业务需求，这个动作比较大，一般非核心系统上的核心问题，不会这么大动干戈，绝大多数情况，还是需要靠DBA尽可能发挥聪明才智来解决。

SQL性能瓶颈定位

现在，我们来看下这个SQL的执行计划：

yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` WHERE 
 `date` = '2017-03-02' AND `icnt` > 100 AND `iid` = '502302'\G
*************************** 1. row ***************************
   id: 1
 select_type: SIMPLE
  table: t1
 partitions: p20170302
   type: range
possible_keys: date,date_2
   key: date
  key_len: 3
   ref: const
   rows: 9384602
  Extra: Using where

这个执行计划看起来还好，有索引可用，也没临时表，也没filesort。不过，我们也注意到，预计要扫描的行数还是挺多的 rows: 9384602，而且要扫描zheng整个分区的所有数据，难怪效率不高，总是SLOW QUERY。

优化思考

我们注意到这个SQL总是要查询某一天的数据，这个表已经做了按天分区，那是不是可以忽略 WHERE 子句中的时间条件呢？

还有，既然去掉了 date 条件，反观表DDL，剩下的条件貌似就没有合适的索引了吧？

所以，我们尝试新建一个索引：

yejr@imysql.com[myDB]> ALTER TABLE t1 ADD INDEX iid (iid, icnt);

然后，把SQL改造成下面这样，再看下执行计划：

yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` partition(p2017030) WHERE 
 `icnt` > 100 AND `iid` = '502302'\G
*************************** 1. row ***************************
   id: 1
 select_type: SIMPLE
  table: t1
 partitions: p20170302
   type: ref
possible_keys: date,date_2,iid
   key: iid
  key_len: 10
   ref: const
   rows: 7800
  Extra: Using where
这优化效果，杠杠滴。

事实上，如果不强制指定分区的话，也是可以达到优化效果的：

yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` WHERE 
 `date` = '2017-03-02' AND `icnt` > 100 AND `iid` = '502302'\G
*************************** 1. row ***************************
   id: 1
 select_type: SIMPLE
  table: t1
 partitions: p20170302
   type: ref
possible_keys: date,date_2,iid
   key: iid
  key_len: 10
   ref: NULL
   rows: 7800
  Extra: Using where

后记

绝大多数的SQL通过添加索引、适当调整SQL代码（例如调整驱动表顺序）等简单手法来完成。

多说几句，遇到SQL优化性能瓶颈问题想要在技术群里请教时，麻烦先提供几个必要的信息：

表DDL
表常规统计信息，可执行 SHOW TABLE STATUS LIKE ‘t1' 查看
表索引分布信息，可执行 SHOW INDEX FROM t1 查看
有问题的SQL及相应的执行计划没有这些信息的话，就别去麻烦别人了吧。

以上就是分区表场景下的 SQL 优化的详细内容，更多关于sql分区表优化的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

sql server中死锁排查的全过程分享
死锁是指在一组进程中的各个进程均占有不会释放的资源，但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态。下面这篇文章主要给大家介绍了关于sql server中死锁排查的相关资料，需要的朋友可以参考下
2018-05-05
SQL Server数据库游标的基本操作指南
这篇文章主要给大家介绍了关于SQL Server数据库游标的基本操作指南,SQL Server游标是一种用于遍历查询结果集的数据库对象,它可以逐行处理查询结果,并执行相关的操作,需要的朋友可以参考下
2023-11-11
一文搞懂SQL注入攻击
SQL注入（SQL Injection）攻击是其中最普遍的安全隐患之一，因此，如何防范SQL注入攻击成为了网络安全领域的一个重要议题。本文通过代码示例详细介绍了SQL注入攻击，需要的朋友可以参考一下
2023-04-04
用SQL语句实现替换字符串
这样可以方便我们直接在数据库中替换字符
2008-07-07
SQL SERVER 表与表之间字段一对多sql语句写法
这篇文章主要介绍了SQL SERVER 表与表之间字段一对多sql语句写法,需要的朋友可以参考下
2017-01-01
sql查询一个数组中是否包含某个内容find_in_set问题
这篇文章主要介绍了sql查询一个数组中是否包含某个内容find_in_set问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-01-01
命令行启动mssqlserver服务的方法示例
这篇文章主要介绍了命令行启动mssqlserver服务的方法，大家参考使用
2013-11-11
利用sql函数生成不重复的订单号的代码
利用sql函数生成不重复的订单号的代码，需要的朋友可以参考下。
2011-12-12
delete误删数据使用SCN号恢复(推荐)
这篇文章主要介绍了使用scn号恢复误删数据问题，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2019-12-12
SQL判断字段列是否存在的方法
本文介绍了SQL判断字段列是否存在的方法，需要的朋友可以参考一下
2013-03-03

分区表场景下的 SQL 优化

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具