MySQL之join查询优化方式

更新时间：2023年03月12日 15:49:49 作者：布道

这篇文章主要介绍了MySQL之join查询优化方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

MySQL join查询优化

在日常的开发中，我们经常遇到这样情况：select * from TableA inner join TableB...它响应速度一直很快的，随着数据的增长，突然有一天开始很慢了。那该怎么破？

对，驱动表是突破口，

1. 那什么是驱动表呢？

指定了联接条件时，满足查询条件的记录行数少的表为驱动表
未指定联接条件时，行数少的表为驱动表（Important!）

如果你搞不清楚该让谁做驱动表、谁 join 谁，就别指定谁 left/right join 谁了，请交给 MySQL优化器运行时决定吧。

2. 复杂的sql怎么识别驱动表呢？

按经验谈，使用EXPLAIN，第一行出现的表就是驱动表。

3. 关联查询原理是怎样的？

MySQL 表关联的算法是 Nest Loop Join，是通过驱动表的结果集作为循环基础数据，然后一条一条地通过该结果集中的数据作为过滤条件到下一个表中查询数据，然后合并结果。

//例: user表10000条数据，class表20条数据
select * from user u left join class c u.userid=c.userid

上面sql的后果就是需要用user表循环10000次才能查询出来，而如果用class表驱动user表则只需要循环20次就能查询出来。

4. 该如如何优化？

优化的目标是尽可能减少JOIN中Nested Loop的循环次数，以此保证：永远用小结果集驱动大结果集。

排序的字段也有影响，有条原则：对驱动表可以直接排序，对非驱动表（的字段排序）需要对循环查询的合并结果（临时表）进行排序！

5. 实例

explain select * from user u left join class c on u.userid=c.userid INNER JOIN subject s on c.subjectId=s.id 
 WHERE 1=1 ORDER BY u.create_time DESC limit 0,10

够复杂吧。假如，user表有千万级记录，class表要少得多，从执行计划的得知驱动表（数据到千万级）。由于动用了“LEFT JOIN”，所以相当于已经指定了驱动表。

如何优化？

//优化第一步：LEFT JOIN改为JOIN，对，直接 join！
explain select * from user u join class c on u.userid=c.userid INNER JOIN subject s on c.subjectId=s.id 
 WHERE 1=1 ORDER BY u.create_time DESC limit 0,10
//优化第二步：从上面执行计划得知， 有Using temporary(临时表);Using filesort，解决方法是调整排序字段（借助前面讲过排序的原则）
explain select * from user u join class c on u.userid=c.userid INNER JOIN subject s on c.subjectId=s.id 
 WHERE 1=1 ORDER BY c.id DESC limit 0,10

总之，sql优化中explain工具是非常重要的武器。

MySQL优化(关联查询优化)

准备数据

#分类
CREATE TABLE IF NOT EXISTS `class` (
`id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
`card` INT(10) UNSIGNED NOT NULL,
PRIMARY KEY (`id`)
);
#图书
CREATE TABLE IF NOT EXISTS `book` (
`bookid` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
`card` INT(10) UNSIGNED NOT NULL,
PRIMARY KEY (`bookid`)
);
 
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
 
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));

left join左外连接

看这个分析结果发现：在 class 表上添加的索引起的作用不大。

结论：

- **小表驱动大表**

- 小表：相对来说记录较少的表
- 大表：相对来说记录较多的表

- 驱动方式识别

left join：左边驱动右边（此时把小表放在左边）
right join：右边驱动左边（此时把小表放在右边）

- 加索引的方式：通常建议在大表（被驱动）的表加索引，效率提升更明显。

- 原因：

原因1：被驱动表加了索引之后，收益更大。从 ALL -> ref
原因2：外连接首先读取驱动表的全部数据，被驱动只读取满足连接条件的数据。

inner join：MySQL会自动根据表中的数据选择驱动表

小结：

- 保证被驱动表的 join 字段被索引。join 字段就是作为连接条件的字段。

- left join 时，选择小表作为驱动表（放左边），大表作为被驱动表（放右边）

- inner join 时，mysql 会自动将小结果集的表选为驱动表。

- 子查询尽量不要放在被驱动表，衍生表建不了索引

- 能够直接多表关联的尽量直接关联，不用子查询

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

在linux命令下导出导入.sql文件的方法
这篇文章主要介绍了在linux命令下导出导入.sql文件的方法，具有很好的参考价值，给大家做个参考，跟随小编过来看看吧
2018-05-05
MySQL性能优化之如何高效正确的使用索引
这篇文章主要介绍了MySQL如何高效正确的使用索引，帮助大家更好的理解和学习MySQL，感兴趣的朋友可以了解下
2020-08-08
Mysql常用函数之Rank排名函数详解
这篇文章主要介绍了Mysql常用函数之Rank排名函数详解,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-01-01
MySQL数据类型优化原则
这篇文章主要介绍了MySQL数据类型优化原则的相关资料，帮助大家更好的理解和使用MySQL数据库，感兴趣的朋友可以了解下
2020-11-11
mysql中一个普通ERROR 1135 (HY000)错误引发的血案
ERROR 1135 (HY000): Can’t create a new thread (errno 11);if you are not out of available memory,you can consult the manual for a possible OS-dependent bug
2015-08-08
MySQL 处理重复数据的方法(防止、删除)
这篇文章主要介绍了MySQL 处理重复数据的方法，文中示例代码非常详细，帮助大家更好的理解和学习，感兴趣的朋友可以了解下
2020-07-07
在MySQL中创建实现自增的序列（Sequence）的教程
这篇文章主要介绍了在MySQL中创建实现自增的序列（Sequence）的教程,分别列举了两个实例并简单讨论了一些限制因素,需要的朋友可以参考下
2015-12-12
Mysql中通用表达式WITH AS语句的使用实例代码
with as也叫子查询,用来定义一个sql片段,且该片段会被整个sql语句反复使用很多次,这个sql片段就相当于是一个公用临时表,下面这篇文章主要给大家介绍了关于Mysql中通用表达式WITH AS语句使用的相关资料,需要的朋友可以参考下
2022-08-08
MySQL查询条件中in会用到索引吗
这篇文章主要给大家介绍了MySQL查询条件中in会不会用到索引的相关资料，文中通过示例代码介绍的非常详细，对大家学习或者使用MySQL具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧
2019-07-07
mysql二进制日志文件恢复数据库
喜欢的在服务器或者数据库上直接操作的兄弟们你值得收藏下！不然你就悲剧了。-----(当然我也是在网上搜索的资料！不过自己测试通过了的！)
2014-08-08