记一次因线上mysql优化器误判引起慢查询事件

更新时间：2017年02月26日 10:03:22 作者：rfyiamcool

这篇文章主要介绍了记一次因线上mysql优化器误判引起慢查询事件的相关资料以及最终的解决方案，分享给大家，希望能够给大家一点启发。

前言:

收到疯狂的慢查询及请求超时报警，通过metrics分析出来自mysql请求的异常，cli —> show proceslist 看到很多慢查询。先前该sql是没有的，后面因为数据量的增长才出现了这问题。虽然feeds表大到一个亿，但因为feeds流信息有近期热的特征，所以不是因为 innodb_buffer_pool_size 低效引起的io频繁。后来经过进一步explain执行计划分析得出了原因，mysql查询优化器选择了他认为高效的索引。

mysql查询优化器大多数情况是靠谱的! 但是你的sql语言含有多个索引时就要注意了，往往最后的结果令人有些彷徨了。因为mysql同一个sql只能使用一个索引，那么选择哪个呢？在数据量小时候，mysql优化器会把主键索引后置，优先使用 index和unique 。当你达到一个数据量级后，又因为你的查询操作有 in ，那么mysql查询优化器很可能会选用主键的！

记住一句话，mysql查询优化是基于检索成本考虑，而不是基于时间成本考虑。优化器是根据现有的数据状态来推算代价，而不是真的去执行一遍sql.

所以，mysql优化器并不是每次都可以达到优化的效果的。它并不能准确预估代价，如果要准确得到走各个索引的代价就要去真的执行一遍才能知道，所以代价分析只是做了一个预估，既然是预估那么就有误判。

我们这里说的表是feed信息流表，我们知道feeds信息流表访问不仅频繁，而且数据量也很大。但是这个表的数据结构很简单，索引也简单. 一共就两个索引，一个是主键索引，一个是unique唯一键索引。

如下，该表的量级已经到亿级别了，因为有足够多的cache前顶，又因为这样那样的原因，所以没来的及做分库分表。

问题是这样的，当数据量级不到一个亿的时候，mysql优化器选择使用 index索引，当数据量级超过一个亿后，mysql查询优化器选择使用主键索引了。这样带来的问题就是查询速度太慢。

这是正常情况下:

mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377)     AND cid IN (1001,1005,1054,1092,1093,1095)  AND id <= 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
*************************** 1. row ***************************
      id: 1
 select_type: SIMPLE
    table: feed
  partitions: NULL
     type: range
possible_keys: PRIMARY,feed_user_target
     key: feed_user_target
   key_len: 6
     ref: NULL
     rows: 18
   filtered: 50.00
    Extra: Using where; Using index; Using filesort
1 row in set, 1 warning (0.00 sec)

同样的sql语句，在数据量有较大变化后，mysql查询优化器对索引的选择也有了变化。

mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377)    AND cid IN (1001,1005,1054,1092,1093,1095)    AND id <= 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
*************************** 1. row ***************************
      id: 1
 select_type: SIMPLE
    table: feed
     type: range
possible_keys: PRIMARY,feed_user_target
     key: PRIMARY
   key_len: 4
     ref: NULL
     rows: 11873197
    Extra: Using where
1 row in set (0.00 sec)

那么解决方法是使用 force index，强制查询优化器使用我们给出的index 。我这里是python开发环境，常见的python orm都有force index，ignore index，user index 参数的。

explain SELECT * FROM `feed` force index (feed_user_target) WHERE user_id IN (116537309,116709093,116709377) ...

那么我们应该怎么预防这种因为数据的增进，mysql优化器选择了一个低效索引的问题呢？

针对这个问题请教了几个厂的dba，得到的答案和我们的方法是一样的。都是只能通过后期的慢查询来发现问题，然后在sql语句中指定force index来解决索引问题。另外，在系统上线初期就会做这类问题的规避，但往往业务开发人员初期都会配合dba们的审查工作，但后期为了省事，或者说自以为是认为没有问题，所以造成了 mysql查询事故。

我自己对于mysql优化器选择索引规则一知半解的，后面准备花时间好好研究下规则

您可能感兴趣的文章:

解析mysql修改为utf8后仍然有乱码的问题
本篇文章是对mysql修改为utf8后仍然有乱码的问题进行了详细的分析介绍，需要的朋友参考下
2013-06-06
MySQL中查询字段为空或者为null的方法
这篇文章主要介绍了MySQL中查询字段为空或者为null的方法，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-12-12
MySQL删除数据，表文件大小依然没变的原因
这篇文章主要介绍了MySQL删除数据，表文件大小依然没变的原因，帮助大家更好的理解MySQL中的数据表，感兴趣的朋友可以了解下
2020-10-10
MySql 5.7.20安装及data和my.ini文件的配置
本文通过图文并茂的形式给大家介绍了MySql 5.7.20安装及data和my.ini文件的配置方法，本文给大家介绍的非常详细，需要的朋友参考下吧
2017-11-11
详解Mysql基础语法的使用
MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，目前属于 Oracle 旗下产品。这篇文章主要介绍了Mysql基础语法的使用,需要的朋友可以参考下
2018-07-07
深入理解mysql的自连接和join关联
这篇文章主要给大家介绍了关于mysql的自连接和join关联的相关资料，文中介绍的非常详细，相信对大家具有一定的参考价值，需要的朋友们下面来一起看看吧。
2017-04-04
MySQL 获得当前日期时间函数
这篇文章主要介绍了MySQL 获得当前日期时间函数非常不错，具有参考借鉴价值,需要的朋友可以参考下
2017-07-07
MySQL使用B+Tree当索引的优势有哪些
这篇文章主要介绍了MySQL使用B+Tree当索引有哪些优势，帮助大家更好的理解和学习使用MySQL，感兴趣的朋友可以了解下
2021-03-03
MySQL触发器概念、原理与用法详解
这篇文章主要介绍了MySQL触发器概念、原理与用法,结合实例形势详细分析了mysql触发器相关概念、原理、创建、用法及操作注意事项,需要的朋友可以参考下
2019-07-07
关于MySQL存取图片的三种方式(含源码示例)
最近在做小程序的后台,要求将小程序用户以upload方法上传的图片保存到mysql数据库中,然后机缘巧合三种方式都试了,所以专门整理出来分享给大家,可能有的地方说的不太对,欢迎大家帮纠正,需要的朋友可以参考下
2024-04-04

记一次因线上mysql优化器误判引起慢查询事件

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具