MySQL 覆盖索引的优点

 更新时间:2021年05月19日 11:15:53   作者:岛上码农  
当索引包含了所有查询的数据时,这个索引就称之为覆盖索引。覆盖索引能够成为一个非常有力的工具并且能够显著改善性能,本文将具体讲述覆盖索引的优点

一个通常的建议是为WHERE条件创建索引,但这其实是片面的。索引应当为全部查询设计,而不仅仅是WHERE条件。索引确实能有效地查找数据行,但MySQL也能够使用索引获取列数据,这样根本不需要去读取一行数据。毕竟,索引的叶子节点包含了索引对应的值。当年能够读取索引就能够拿到想要的数据时为什么还去读数据行呢?当索引包含了所有查询的数据时,这个索引就称之为覆盖索引。

覆盖索引能够成为一个非常有力的工具并且能够显著改善性能。考虑一下不读数据只需要读取索引的情况:

  • 索引值通常会比整个行存储空间小很多,因此MySQL只读取索引值时可以只读取很少的数据。这对于缓存负荷来说十分重要——响应时间大部分消耗在复制数据。对于磁盘I/O而言也是一样,因为索引数据相比行数据存储空间小很多,因此更节省I/O负载和内存占用(对于MyISAM引擎更显著,因为MyISAM可以将索引打包使得存储空间更小)。
  • 索引是按索引值的顺序存储的,因此I/O访问跨度相比随机磁盘位置获取行数据而言消耗的I/O频次更少。对于某些存储引擎,例如MyISAM和Percona XtraDB,你甚至能够使用OPTIMIZE优化表获得完全有序的索引,这会使得简单范围的查询完全使用顺序访问。
  • 有些存储引擎,例如MyISAM,MySQL内存中只缓存索引。由于操作系统为MyISAM缓存了数据,访问时通常需要一个系统调用。这可能导致巨大的性能影响,尤其是对于缓存负荷场景来说,系统调用对于数据访问来说是最昂贵的代价。
  • 由于InnoDB的聚集索引,覆盖索引对于InnoDB来说十分有帮助。InnoDB的辅助索引在其叶子节点中保存了行的主键值。因此,辅助索引覆盖查询后可以避免进行主键查询。

在所有的场景中,最典型的就是相比查找数据行,只包含索引列的查询的代价相当低。需要注意的是,聚集索引并不是任意类型的索引。聚集索引必须存储索引数据列对应的值。哈希,空间和全文索引并没有存储这些值,因此MySQL只能使用二叉树去覆盖查询。而且,不同的存储引擎实现覆盖索引的方式不同,并且并不是全部的存储引擎都支持覆盖索引(例如Memory存储引擎当前就不支持)。

当你验证查询中索引使用了覆盖索引时,使用Explain语句时,会在Extra列中看到“Using index”。例如,在store_goods表有一个(shop_id, goods_category_id1)的多列索引。MySQL可以在查询返回数据只有这两列时使用索引:

EXPLAIN SELECT `goods_category_id1`,`shop_id` FROM `store_goods` WHERE 1

覆盖索引查询在某些情况会让这样的优化失效。MySQL查询优化器在执行查询时会判断索引是否覆盖到。假设索引覆盖了WHERE条件,但没有覆盖整个查询。如果评估结果决定不走覆盖索引,那么MySQL 5.5及以前的版本会直接获取数据行,即便是不需要这些数据,然后才会过滤掉。

让我们看一下为什么这种情况会发生,然后如何重写查询以便解决这个问题。首先查询是这样的:

EXPLAIN SELECT * FROM products WHERE actor='SEAN CARREY' AND title like '%APOLLO%'

这个时候的结果是不会走覆盖索引,而是普通的索引,这是因为:

  • 没有索引覆盖了查询数据列,因为我们从数据表读取了全部列并且没有索引列覆盖了全部列。理论上,MySQL还有一个快捷方式可以使用,那就是WHERE条件中使用了索引覆盖的列,因此MySQL可以先使用这个索引找到对应的actor,然后在检查他们的title是否匹配,然后在读取满足条件的全部的数据行。
  • 对于早期的低版本的存储引擎API(MySQL 5.5以前的版本)来说,MySQL无法在索引中使用LIKE操作,而只支持简单的比较操作(=,IN,>=)。MySQL可以在索引中使用前缀匹配的LIKE查询,这是因为它可以将它们转换为比较操作。但是前导通配符(也就是LIKE中前置的%)导致存储引擎无法评估匹配条件。因此,MySQL会获取行数据再比较,而不是索引的值。

有一种方式可以使用巧妙的组合索引和重写查询条件。我们可以将索引扩展到(artist, title, prod_id),然后像下面那样重写查询语句:

EXPLAIN SELECT * 
FROM products
	JOIN (
    SELECT prod_id
    FROM products
    WHERE actor='SEAN CARREY' AND TITLE LIKE '%APOLLO%'
 ) AS t1 ON (t1.prod_id=products.prod_id)

我们称之为“递延JOIN(deferred join)”,因为它延迟了列的访问。在第一阶段的查询中,当它在子查询中找到了匹配的行的过程中,MySQL使用了覆盖索引。虽然在整个查询中没有覆盖到,但总比没有的好。

这种优化的效果好坏取决于WHERE条件查找到了多少行数据。假设products表包含了上百万行的数据。可以对比一下这两种查询的性能对比,总的数据为100万行。

  • 第一种情况:有30000个products的actor是“SEAN CARREY”,其中20000个的title包含“APOLLO”;
  • 第二种情况:有30000个products的actor是“SEAN CARREY”,其中40个的title包含“APOLLO”;
  • 第三种情况:有50个products的actor是“SEAN CARREY”,其中10个的title包含“APOLLO”。

对比结果如下表。

数据集 原始查询 优化后查询
第一种情况 5qps 5qps
第二种情况 7qps 35qps
第三种情况 2400qps 2000qps

结果的解释如下:

  • 在第一种情况中,查询返回了很大的结果集,因此看不到优化效果。大部分时间花在了读取和发送数据。
  • 在第二种情况中,使用覆盖索引后子查询过滤得到了一个小的结果集,这样优化的效果是性能提升了5倍。产生这种效果的原因是相比查出30000行的数据集,这里只需要读取40行。
  • 第三种情况显示了子查询失效了。覆盖索引过滤返回的结果集太少了,导致子查询的代价比直接从数据表读取数据还要高。

在大多数存储引擎中,一个索引只能够覆盖访问列是索引的一部分。然而,InnoDB实际上会做进一步的优化。想想InnoDB的的辅助索引在叶子节点中存储了主键的值。这意味着InnoDB的辅助索引实际上有了额外的列帮助InnoDB使用覆盖索引。 例如,sakila.actor表使用了InnoDB,然后在last_name有一个索引,因此这个索引能够覆盖或者主键actor_id的查询——即便这个列并不是索引的一部分。

EXPLAIN SELECT actor_id, last_name
FROM sakila.actor WHERE last_name = 'HOPPER'

以上就是MySQL 覆盖索引的优点的详细内容,更多关于MySQL 覆盖索引的资料请关注脚本之家其它相关文章!

相关文章

  • MySQL临时表满了/临时表空间耗尽的解决方法

    MySQL临时表满了/临时表空间耗尽的解决方法

    当你收到“临时表满了”的警报时,通常意味着 MySQL 在处理查询时创建的临时表空间已经耗尽,本文主要介绍了MySQL临时表满了/临时表空间耗尽的解决方法,感兴趣的可以了解一下
    2024-08-08
  • MySQL远程无法连接的一些常见原因总结

    MySQL远程无法连接的一些常见原因总结

    有的小伙伴发现自己的mysql无法正常连接远程服务器,下面这篇文章主要给大家介绍了关于MySQL远程无法连接的一些常见原因,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • php mysql insert into 结合详解及实例代码

    php mysql insert into 结合详解及实例代码

    在mysql中如果要保存数据到数据库我们就会用到insert into命令了,下面我来给大家介绍mysql insert into几种常用的使用方法,需要的朋友可以参考下
    2016-11-11
  • Mysql 安装及my.ini的创建过程

    Mysql 安装及my.ini的创建过程

    这篇文章主要介绍了Mysql 安装及my.ini的创建过程,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • 安装MySQL后include目录下没有找到libmysql.lib

    安装MySQL后include目录下没有找到libmysql.lib

    安装了MySQL后,在其安装目录下的include文件夹并没有找到libmysql.lib,主要原因是在安装MySQL的时候,没有勾选develop component这一选项造成的
    2014-08-08
  • Linux环境下mysql5.7.13安装教程

    Linux环境下mysql5.7.13安装教程

    这篇文章主要为大家详细介绍了Linux环境下mysql5.7.13安装教程,感兴趣的小伙伴们可以参考一下
    2016-07-07
  • 细说MySQL死锁与日志二三事

    细说MySQL死锁与日志二三事

    这篇文章主要和大家一起聊一聊MySQL死锁与日志二三事,实际业务当中如何快速的定位线上MySQL问题,修复异常?本文根据两个实际case,分享下相关的经验与方法,感兴趣的小伙伴们可以参考一下
    2017-08-08
  • MySQL Flink实时流处理的核心技术之窗口机制

    MySQL Flink实时流处理的核心技术之窗口机制

    Flink是一款流处理框架,窗口机制是其核心技术之一。Flink的窗口机制可以将无限的数据流划分为有限的窗口,并对窗口内的数据进行处理。Flink的窗口机制支持时间、计数、会话等多种窗口类型,并且可以在不同的窗口之间进行流转换和数据聚合,是实时流处理中非常重要的技术
    2023-05-05
  • 阿里云ESC 安装 MYSQL8.0的教程

    阿里云ESC 安装 MYSQL8.0的教程

    这篇文章主要介绍了阿里云ESC 安装 MYSQL8.0的教程,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-12-12
  • MySQL之表碎片化的问题解决

    MySQL之表碎片化的问题解决

    MySQL数据库的碎片是由于频繁的增删改查操作导致的数据块不连续或不规则分布,本文主要介绍了MySQL之表碎片化的问题解决,具有一定的参考价值,感兴趣的可以了解一下
    2024-08-08

最新评论