解读SQL中GROUP BY和HAVING子句中使用NULL条件问题

 更新时间:2024年10月16日 16:23:05   作者:qianer0_0  
在使用SQL进行数据查询时,可能会遇到查询结果为空的情况,这通常与GROUP BY和HAVING子句的使用有关,尤其是在处理包含NULL值的字段时,当使用GROUP BY进行数据分组,并在HAVING子句中直接判断字段是否为NULL时

SQL中GROUP BY和HAVING子句中使用NULL条件

  • SQL :
SELECT COUNT(1), tid, sap_do, batch, skucode,batch 
FROM lt 
WHERE IFNULL(sap_do, '') != '' 
AND created_time >= 1722441600 
GROUP BY tid, sap_do, skucode 
HAVING COUNT(1) > 1 
AND batch IS NULL; 

查询结果为空;实际数据库存在batch IS NULL的

  • 修改后:
SELECT COUNT(1), tid, sap_do, skucode, batch 
FROM lt 
WHERE IFNULL(sap_do, '') != '' 
AND created_time >= 1722441600 
GROUP BY tid, sap_do, skucode 
HAVING COUNT(1) > 1 
AND SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0;

问题的核心在于 GROUP BY 和 HAVING 子句的工作方式,以及 NULL 的处理规则

1. HAVING batch IS NULL 没有数据的原因

当你使用 GROUP BY 并在 HAVING 子句中直接使用 batch IS NULL,SQL 会在分组后的结果中查找 batch 的值是否为 NULL。但是由于 GROUP BY 会对所有同一组内的数据进行聚合,batch 字段可能包含 NULL 和非 NULL 的混合值。

对于 GROUP BY 而言,它不会简单地保留 batch 字段的某一个特定值,因此如果某个分组内的 batch 值既有 NULL 又有非 NULL 的情况,batch IS NULL 这个条件会失效,因为 SQL 无法确定这一组的 batch 值究竟是 NULL 还是非 NULL。

直接使用 HAVING batch IS NULL 通常只能在整个分组的 batch 全部是 NULL 的情况下才会生效。

简而言之,当 batch 列在分组后不全是 NULL 时,HAVING batch IS NULL 无法筛选出结果。

2. HAVING SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0 结果正确的原因

SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) 的逻辑是通过 CASE 语句来计算某个分组内 batch 列为 NULL 的记录数。

SUM 是对整个分组内的每一条记录进行处理,因此即使该组内存在 batch 的非 NULL 值,只要有任何一条记录的 batch 是 NULL,SUM 就能正确计算出这一组包含 NULL 值的数量。

解释:

  • SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0:通过这个 SUM,我们计算出当前分组内有多少条记录的 batch 为 NULL,如果结果大于 0,说明这一组内存在 NULL 值的 batch。
  • HAVING batch IS NULL:只能筛选出分组后 batch 的值完全为 NULL 的情况,无法处理那些包含 NULL 和非 NULL 值的分组。

总结

HAVING batch IS NULL 只能处理整个分组中的 batch 全为 NULL 的情况,这在有混合值的分组中会导致结果为空。

HAVING SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0 可以处理分组中包含 NULL 和非 NULL 的情况,因此它能正确返回包含 NULL 值的分组。

这种 SUM(CASE WHEN…) 逻辑提供了更细粒度的控制,可以确保即使在分组中存在多个不同的 batch 值,依然可以正确识别出那些包含 NULL 的分组。

补充

如果查询id字段的话 上面的SQL结果会发现,id结果不是我们想要的batch为null的行ID

可改造SQL为下面 执行:

SELECT id, tid, sap_do, skucode, batch 
FROM lt
WHERE batch IS NULL
AND (tid, sap_do, skucode) IN (
    SELECT tid, sap_do, skucode
    FROM lt 
    WHERE IFNULL(sap_do, '') != ''
    AND created_time >= 1725120000
    GROUP BY tid, sap_do, skucode
    HAVING COUNT(1) > 1
    AND SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0
);

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • windows下忘记MySQL密码的修改方法

    windows下忘记MySQL密码的修改方法

    这篇文章主要介绍了windows下忘记MySQL密码的修改方法,需要的朋友可以参考下
    2014-03-03
  • mysql 8.0.27 解压版安装配置方法图文教程

    mysql 8.0.27 解压版安装配置方法图文教程

    这篇文章主要为大家详细介绍了mysql 8.0.27 解压版安装配置方法图文教程,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • 一些mysql启动参数的说明和优化方法

    一些mysql启动参数的说明和优化方法

    要求MySQL能有的连接数量。当主要MySQL线程在一个很短时间内得到非常多的连接请求,这就起作用,然后主线程花些时间(尽管很短)检查连接并且启动一个新线程。
    2011-04-04
  • MySQL prepare原理详解

    MySQL prepare原理详解

    这篇文章主要介绍了MySQL prepare的相关内容,包括prepare的产生,在服务器端的执行过程,以及jdbc对prepare的处理以及相关测试,需要的朋友可以了解下。希望对大家有所帮助。
    2017-09-09
  • mysql 常用设置 字符集编码、自动完成(自动提示)、监听外网ip

    mysql 常用设置 字符集编码、自动完成(自动提示)、监听外网ip

    mysql 常用设置 字符集编码、自动完成(自动提示)、监听外网ip,需要的朋友可以参考下
    2012-07-07
  • 解决MySQL8.0时区的问题步骤

    解决MySQL8.0时区的问题步骤

    这篇文章主要介绍了解决MySQL8.0时区的问题步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • MySQL NDB Cluster关于Nginx stream的负载均衡配置方式

    MySQL NDB Cluster关于Nginx stream的负载均衡配置方式

    这篇文章主要介绍了MySQL NDB Cluster关于Nginx stream的负载均衡配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-05-05
  • mysql 8.0.15 安装图文教程及数据库基础

    mysql 8.0.15 安装图文教程及数据库基础

    这篇文章主要为大家详细介绍了mysql 8.0.15 安装方法图文教程,及数据库基础知识,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-03-03
  • MySQL Hash索引和B-Tree索引的区别

    MySQL Hash索引和B-Tree索引的区别

    MySQL Hash索引和B-Tree索引的区别究竟在哪里呢?相信很多人都有这样的疑问,下文对两者的区别进行了详细的分析,需要的朋友可以参考下
    2014-03-03
  • 一篇文章学会SQL中的递归用法(Mysql)

    一篇文章学会SQL中的递归用法(Mysql)

    这篇文章主要给大家介绍了关于如何一篇文章学会SQL中的递归用法,众所周知目前的mysql版本中并不支持直接的递归查询,但是通过递归到迭代转化的思路,还是可以在一句SQL内实现树的递归查询的,需要的朋友可以参考下
    2023-10-10

最新评论