MySQL中join语句怎么优化

 更新时间:2023年03月03日 10:05:01   作者:Java识堂  
本文主要介绍了MySQL中join语句怎么优化,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

Simple Nested-Loop Join

我们来看一下当进行 join 操作时,mysql是如何工作的。常见的 join 方式有哪些?

在这里插入图片描述

如图,当我们进行连接操作时,左边的表是驱动表,右边的表是被驱动表

Simple Nested-Loop Join 这种连接操作是从驱动表中取出一条记录然后逐条匹配被驱动表的记录,如果条件匹配则将结果返回。然后接着取驱动表的下一条记录进行匹配,直到驱动表的数据全都匹配完毕

因为每次从驱动表取数据比较耗时,所以MySQL并没有采用这种算法来进行连接操作

Block Nested-Loop Join

在这里插入图片描述

既然每次从驱动表取数据比较耗时,那我们每次从驱动表取一批数据放到内存中,然后对这一批数据进行匹配操作。这批数据匹配完毕,再从驱动表中取一批数据放到内存中,直到驱动表的数据全都匹配完毕

批量取数据能减少很多IO操作,因此执行效率比较高,这种连接操作也被MySQL采用

对了,这块内存在MySQ中有一个专有的名词,叫做 join buffer,我们可以执行如下语句查看 join buffer 的大小

show variables like '%join_buffer%'

在这里插入图片描述

把我们之前用的 single_table 表搬出来,基于 single_table 表创建2个表,每个表插入1w条随机记录

CREATE TABLE single_table (
    id INT NOT NULL AUTO_INCREMENT,
    key1 VARCHAR(100),
    key2 INT,
    key3 VARCHAR(100),
    key_part1 VARCHAR(100),
    key_part2 VARCHAR(100),
    key_part3 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    KEY idx_key1 (key1),
    UNIQUE KEY idx_key2 (key2),
    KEY idx_key3 (key3),
    KEY idx_key_part(key_part1, key_part2, key_part3)
) Engine=InnoDB CHARSET=utf8;

create table t1 like single_table;
create table t2 like single_table;

如果直接使用 join 语句,MySQL优化器可能会选择表 t1 或者 t2 作为驱动表,这样会影响我们分析sql语句的过程,所以我们用 straight_join 让mysql使用固定的连接方式执行查询

select * from t1 straight_join t2 on (t1.common_field = t2.common_field)

运行时间为0.035s

在这里插入图片描述

执行计划如下

在这里插入图片描述

在Extra列中看到了 Using join buffer ,说明连接操作是基于 Block Nested-Loop Join 算法

Index Nested-Loop Join

了解了 Block Nested-Loop Join 算法之后,可以看到驱动表的每条记录会把被驱动表的所有记录都匹配一遍,非常耗时,能不能提高一下被驱动表匹配的效率呢?

估计这种算法你也想到了,就是给被驱动表连接的列加上索引,这样匹配的过程就非常快,如图所示

在这里插入图片描述

我们来看一下基于索引列进行连接执行查询有多快?

select * from t1 straight_join t2 on (t1.id = t2.id)

执行时间为0.001秒,可以看到比基于普通的列进行连接快了不止一个档次

在这里插入图片描述

执行计划如下

在这里插入图片描述

驱动表的记录并不是所有列都会被放到 join buffer,只有查询列表中的列和过滤条件中的列才会被放入 join buffer,因此我们不要把 * 作为查询列表,只需要把我们关心的列放到查询列表就好了,这样可以在 join buffer 中放置更多的记录

如何选择驱动表?

知道了 join 的具体实现,我们来聊一个常见的问题,即如何选择驱动表?

如果是 Block Nested-Loop Join 算法:

  • 当 join buffer 足够大时,谁做驱动表没有影响
  • 当 join buffer 不够大时,应该选择小表做驱动表(小表数据量少,放入 join buffer 的次数少,减少表的扫描次数)

如果是 Index Nested-Loop Join 算法

假设驱动表的行数是M,因此需要扫描驱动表M行

被驱动表的行数是N,每次在被驱动表查一行数据,要先搜索索引a,再搜索主键索引。每次搜索一颗树近似复杂度是以2为底N的对数,所以在被驱动表上查一行的时间复杂度是 2 ∗ l o g 2 N 2*log2^N 2∗log2N

驱动表的每一行数据都要到被驱动表上搜索一次,整个执行过程近似复杂度为 M + M ∗ 2 ∗ l o g 2 N M + M*2*log2^N M+M∗2∗log2N

显然M对扫描行数影响更大,因此应该让小表做驱动表。当然这个结论的前提是可以使用被驱动表的索引

总而言之,我们让小表做驱动表即可

当 join 语句执行的比较慢时,我们可以通过如下方法来进行优化

  • 进行连接操作时,能使用被驱动表的索引
  • 小表做驱动表
  • 增大 join buffer 的大小
  • 不要用 * 作为查询列表,只返回需要的列

到此这篇关于MySQL中join语句怎么优化的文章就介绍到这了,更多相关MySQL join语句优化内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Mysql中事务ACID的实现原理详解

    Mysql中事务ACID的实现原理详解

    这篇文章主要给大家介绍了关于Mysql中事务ACID实现原理的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Mysql具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • 深入了解MySQL中的慢查询

    深入了解MySQL中的慢查询

    什么是MySQL慢查询呢?其实就是查询的SQL语句耗费较长的时间。具体耗费多久算慢查询呢?这其实因人而异,有些公司慢查询的阈值是100ms,有些的阈值可能是500ms。本文将通过示例和大家聊聊慢查询的危害和常用场景,感兴趣的可以了解一下
    2022-10-10
  • MySQL数据库如何导入导出(备份还原)

    MySQL数据库如何导入导出(备份还原)

    这篇文章主要介绍了MySQL数据库如何导入导出(备份还原),需要的朋友可以参考下
    2015-10-10
  • mysql安装报错unknown variable mysqlx_port=0.0

    mysql安装报错unknown variable mysqlx_port=0.0

    本文主要介绍了mysql安装报错unknown variable mysqlx_port=0.0,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2024-06-06
  • MySQL查询优化:LIMIT 1避免全表扫描提高查询效率

    MySQL查询优化:LIMIT 1避免全表扫描提高查询效率

    在某些情况下,如果明知道查询结果只有一个,SQL语句中使用LIMIT 1会提高查询效率,感兴趣的朋友可以了解下哈,希望对你优化mysql查询有所帮助
    2013-04-04
  • mysql根据拼音字母查询(简单易懂的字段拼音查询)

    mysql根据拼音字母查询(简单易懂的字段拼音查询)

    MySQL在开发中,我们经常需要根据字段拼音查询数据库中的数据,它支持多种查询方式,包括根据拼音字母查询,使用 Collation 可以方便地进行简单的拼音查询,而使用拼音索引可以大幅提高查询性能,根据具体的需求和情况,我们可以选择合适的方法来实现拼音查询
    2023-10-10
  • MySQL出现莫名其妙的断开连接以及解决方案

    MySQL出现莫名其妙的断开连接以及解决方案

    这篇文章主要介绍了MySQL出现莫名其妙的断开连接以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-11-11
  • MySQL SQL性能分析之慢查询日志、explain使用详解

    MySQL SQL性能分析之慢查询日志、explain使用详解

    这篇文章主要介绍了MySQL SQL性能分析 慢查询日志、explain使用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-04-04
  • MySQL max_allowed_packet的坑

    MySQL max_allowed_packet的坑

    max_allowed_packet是 MySQL 中的一个设定参数,用于设定所接受的包的大小,根据情形不同,其缺省值可能是 1M 或者 4M,本文主要介绍了MySQL max_allowed_packet的坑,感兴趣的可以了解一下
    2024-01-01
  • Windows7下Python3.4使用MySQL数据库

    Windows7下Python3.4使用MySQL数据库

    这篇文章主要为大家详细介绍了Windows7下Python3.4使用MySQL数据库,MySQL Community Server的安装步骤,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07

最新评论