MYSQL Left Join优化(10秒优化到20毫秒内)

更新时间：2021年12月16日 10:21:14 作者：幽寒冰魄

在实际开发中，相信大多数人都会用到join进行连表查询，但是有些人发现，用join好像效率很低，而且驱动表不同，执行时间也不同。那么join到底是如何执行的呢，本文就详细的介绍一下

【功能背景】

我们需要按照用户订单号和商户号统计出购买的商品数量和售后的商品数量。涉及到的表和关系见下图：

很不幸工程师在起初进行表结构设计的时候没有在商户订单表中记录下购买的商品总数，在商户订单的售后单中也没记录下售后的商品数量。

【原始的SQL】

select 
  o.no,s_order.no,sum(s_item.count),sum(after_sale_item.count)
  from 
  buyer_order o 
  left join seller_order s_order on o.id = s_order.buyer_order_id 
  left join seller_order_item s_item on s_order.id = s_item.seller_order_id
  left join seller_order_after_sale after_sale on s_order.id = after_sale.seller_order_id
  left join seller_order_after_sale_item after_sale_item on after_sale.id = after_sale_item.after_sale_id
where o.add_time >='2019-05-01'
group by
  o.id,s_order.id
order by 
  o.id
limit 0,10

以上SQL几个关键字段都使用了索引。

【原始的SQL分析】

这是一条很常规的SQL，逻辑上也没什么毛病

这条SQL中有较多的连接查询，如果随着售后单的增加，连接的数据就会更多

将符合条件的数据都加载到内存后按照 order.id,s_order.id 进行分组统计，如果有100W的数据会怎样？如果你用代码去实现这么一段统计你会怎么做？

将统计完的数据再按照 order.id 进行排序，取出前10条数据。

从以上的SQL发现需要将符合条件的所有的数据加载到内存后要进行分组，统计，排序，最后再进行分页。我们能不能减少数据的加载数量呢？能不能减少数据库CPU的使用量，能不能先取少量的数据再统计呢？

基于以上的问题，我们进行了优化

【分析步骤】

作为旁观者一开始不了解我们功能需要输出什么样的数据，所以我们一开始要了解每张表存储的是什么样的数据，彼此之间的关系是什么。

我们忘记原来的SQL是什么样的，按照我们需要的数据，再次重新的思考，不要再陷入原来的SQL的漩涡中。

针对上面提出的问题，如何减少数据的加载？能不能先分页数据，再对分页的数据进行单独的统计呢？

那么我们是不是需要对group by进行优化，我们要想办法先分页

大家是否想到了一些方法？

【优化后的SQL】

select 
  o.id,o.no,s_order.no,
  (select sum(sot.count) from seller_order so 
    left join seller_order_item sot on so.id = sot.seller_order_id 
        where so.id =s_order.id ),
  (select sum(osat.count) from seller_order_after_sale osa 
    left join seller_order_after_sale_item osat on osa.id = osat.after_sale_id
        where osa.seller_order_id = s_order.id )
  from 
  buyer_order o 
  left join seller_order s_order on o.id = s_order.buyer_order_id 
where o.addTime >='2019-05-01'
order by 
  o.id
limit 0,10

【优化的SQL分析】

很直观的发现，我们把group by去掉了，因为按照 order.id,s_order.id 分组，实际只对 buyer_order和seller_order表进行连接，逻辑上是一样的进行了分组。
group by不使用的话我们就减少了CPU对数据分组的处理，而且我们只连接主要的表数据，减少了加载到内存中的数据。
以上的操作就完成了我们之前说的先对数据分页。我们取出了10条数据。
接着我们再对10条数据的销售出去的商品数量和售后的数量进行统计
这时候大家发现，我们其实只对分页出来的10条数据进行统计，原来是将所有的数据分组统计后取10条。可以发现我们这样操作大大减少了对数据的统计处理。我们只需要统计我们需要的数据。

以上优化的效果可能远远超出大家的想象。

实际工作中连表的数比我们例子中的要多，未优化的SQL在执行未分页的时候发现一共有70万的数据，我们分页取出10条数据花了10+秒以上的时间，数据量不大但是大部分的时间都消耗在了分组和数据统计，大家可以试着写一段代码对这些数据进行分组和统计，就能明白其中的复杂性。

而实际上无论取出10条和全部取出，时间基本上一样的（不考虑IO），因为先进行了统计。

优化后的SQL，加载到内存中只有2万左右的数据，而且不进行统计，先取出10条数据，然后再对10条数据进行统计，逻辑上比之前的简单多了。优化后的SQL执行时间在20毫秒以内。

其实如果在订单表和售后表都记录了对应的数量，连表数还要少，还不需要进行子查询。有时候设计表的时候还是需要考虑一下统计的需要。

到此这篇关于MYSQL Left Join优化(10秒优化到20毫秒内)的文章就介绍到这了,更多相关MYSQL Left Join优化内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

mysql 5.7.21解压版本安装 Navicat数据库操作工具安装
这篇文章主要为大家详细介绍了mysql 5.7.21解压版本安装，Navicat数据库操作工具安装，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-02-02
mysql连接数设置操作方法(Too many connections)
下面小编就为大家带来一篇mysql连接数设置操作方法(Too many connections)。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-03-03
通过案例分析MySQL中令人头疼的Aborted告警
这篇文章通过案例跟大家分析了MySQL中令人头疼的Aborted告警的相关资料，文中将Aborted告警介绍的非常详细，对大家具有一定的参考学习价值，需要的朋友们下面来一起看看吧。
2017-06-06
自用mysql自带命令实现数据库备份还原的方法
本文章介绍了都是mysql常用的命令一些数据导入导出的命令了，只要我们撑握这些命令就可以方法快速的给我们的数据库进行备份还原了
2012-04-04
SQL实现LeetCode(181.员工挣得比经理多)
这篇文章主要介绍了SQL实现LeetCode(181.员工挣得比经理多),本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
2021-08-08
MySQL 数据库如何解决高并发问题
这篇文章主要介绍了MySQL 如何处理高并发，帮助大家更好的优化MySQL数据库，感兴趣的朋友可以了解下
2020-09-09
MySQL 内存表和临时表的用法详解
这篇文章主要介绍了MySQL 内存表和临时表的用法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
macOS安装Solr并索引MySQL
这篇文章主要介绍了macOS安装Solr并索引MySQL的相关资料,非常不错具有参考借鉴价值，需要的朋友可以参考下
2016-11-11
关于Mysql8.0版本驱动getTables返回所有库的表问题浅析
这篇文章主要给大家介绍了关于Mysql 8.0版本驱动getTables返回所有库的表问题的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2018-12-12
MySQL正则表达式入门教程
这篇文章主要介绍了MySQL正则表达式，一个简单的MySQL正则表达式入门教程,需要的朋友可以参考下
2014-04-04