一文理解kafka rebalance负载均衡

更新时间：2023年03月29日 09:36:09 作者：刘牌

这篇文章主要为大家介绍了kafka rebalance负载均衡的深入理解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

介绍

今天主要分享一下 kafka 的 rebalance，在 kafka 中，rebalance 是一个十分重要的概念，很多时候引发的一些问题可能都是由于 rebalance 引起的，rebalance 也就是再均衡，顾名思义，再均衡就是再次负载均衡，下面会对再均衡进行一个详细的描述。

负载均衡

说再均衡之前，先说一说负载均衡，负载均衡就是将请求分发到不同的操作单元上，我们通俗一点来说，就是将请求分发到不同的服务器上，以减轻单台服务器的压力，提高吞吐量，负载均衡的方式有很多，下面是 nginx 的负载均衡，当客户端请求到 nginx 时，nginx 根据一定的负载均衡算法将请求转发到不同的服务器。

请求应该落到那一台机器上，这取决于我们使用的负载均衡策略，负载均衡策略有很多，比如随机，轮询，LFU，LRU 等等，这取决于我们的选择。

rebalance图示

上面说了负载均衡，其实再均衡也是一样，再 kafka 中，一个消费者群组怎么去消费一个主题下面的分区，该以什么方式去消费这些分区，是我们值得去考虑的，kafka 提供了一个分区分配器，他能协调哪些消费者应该去消费那些分区。

如下图所示，一个消费者群组中有两个消费者，他们各自消费两个分区。

此时加入一个消费者，那么就触发了再均衡操作，kafka 就会重新进行分配，分配后的样子可能是下面的这样，c2 从原来的消费两个分区 partition-3，partition-4 变为只消费 partition-2，partition-4 让 c3 去消费。

从上面我们看出，kafka 的再均衡其实就是协调消费者和分区的消费对应关系，我们一般是希望消费者和分区之间的消费关系尽量做到平衡，别出现某个消费者的负载很高，某个消费者的负载很低，资源不能进行合理的利用。

再均衡产生的条件

再均衡产生的条件就是有消费者加入或者退出，加入和退出的方式有很多，有一些是主动因素，有一些是被动因素，比如我们主动增加一个消费者，这时候就会发生再均衡，我们停掉一个消费者，那么这时候也发生再均衡，还有当消费者和 broker 之间由于长时间没有心跳，那么消费者就被提出，这时候也会发生再均衡，某个主题下的分区数量发生变化，也会发生再均衡，还有其他的一些因素，就不展开了，不过我们应该尽量避免再均衡。

再均衡期间消费者是读取不了任何消息，因为这段时间会对分区进行重新分配，所以之前消费者与分区之间的对应关系已经不存在，需要进行重新分配，所以会出现短暂不可用现象。

主动因素导致消费者的加入和离开是无法避免的，当数据量比较大时，可能需要增加消费者来分担压力，提高吞吐量，所以这时候就需要人为去添加消费者了，这时候发生再均衡是可预见的，但是被动导致再均衡就不可预见了，下面我们从一些参数和原理来说明一下，尽量避免再均衡。

Broker 端参数

group.max.session.timeout.ms：消费者会话的最大超时时间。如果消费者在这个时间内没有发送心跳 GroupCoordinator，那么它会被认为已经失效，会被踢出消费组。
group.min.session.timeout.ms：消费者会话的最小超时时间。如果消费者在这个时间内没有发送心跳 GroupCoordinator，那么它会被认为已经失效，会被踢出消费组。
group.initial.rebalance.delay.ms：消费者组启动时，等待多长时间再进行 rebalance。这个参数可以让消费者有时间加入消费者组。

consumer 端参数

session.timeout.ms：消费者会话的超时时间。如果一个消费者在这个时间内没有发送心跳到组协调器 GroupCoordinator，那么被认为它已经失效了，就会将其踢出消费者组。如果这个值设置过小，那么就会比较消耗资源，但是能够快速的发现 ConsumerCoordinator 是否还“存活”，然后进行 rebalance，如果设置过大，那么就会导致长时间没有收到心跳，可能 ConsumerCoordinator 已经“挂了”一段时间，没有及时进行 rebalance。
heartbeat.interval.ms：消费者发送心跳的时间间隔。心跳是消费者与 GroupCoordinator 之间维持会话的机制，如果一个消费者在这个时间间隔内没有发送心跳，那么 GroupCoordinator 认为它已经失效，然后将其踢出，如果这个值设置过大，那么一个消费者失效时，可能需要等待很长时间才能触发 rebalance，如果过小那么就会比较消耗资源。
max.poll.interval.ms：消费者处理消息的最大时间间隔。如果消费者在这个时间内没有消费完消息导致不能 poll 消息，那么它将被认为已经失效，将被踢出消费者组，这个值默认为 5 分钟。

heartbeat.interval.ms 的值一定要比 session.timeout.ms 小，官网建议是 1/3，比如 heartbeat.interval.ms 为 5s，那么 session.timeout.ms 为 15s，这样的话在这个时间会话内能收到三次心跳，不过这两个的值也要在 Broker 端 group.max.session.timeout.ms(5min)和 group.min.session.timeout.ms(6s)的区间之间。

分配器

消费者和分区之间进行分配是由分配器来完成的，当消费者加入和离开时触发 reabalance，然后会使用分配器从新对分区和消费者进行分配，kafka 有一个分配器接口ConsumerPartitionAssignor，它的下面有一个抽象类AbstractPartitionAssignor，如果我们需要自定义分配器，那么集成抽象类AbstractPartitionAssignor即可，kafka 默认提供了好几种分配器，如 RoundRobinAssignor，RangeAssignor，StickyAssignor，CooperativeStickyAssignor，kafka 默认使用 RangeAssignor。

如下，我创建了一个名称为 musk 的主题，分区数为 4，然后创建一个消费者，那么这时因为只有一个消费者，所以四个分区都划给了它。

此时我又加入一个消费者，因为加入消费者后会触发 rebalance，所以这时候就会对分区重新进行分配，分配后如下，每个消费者划分了两个分区。

对于分配器，kafka 自带的已经能够满足我们大多时候的需求，因为我们在使用多个消费者的时候，其实就是为了让分区被均分给消费组内的消费者，以达到压力的分担。

总结

从上面我们对 rebalance 进行一些介绍，对 rebalance 产生的原因进行说明，对消费者协调器和组协调器进行了解，对一些参数进行详解，还有通过测试 rebalance 来更加直观说明 rebalance，rebalance 的触发有很多方式，不过我们应该尽量去避免它的发生，对于分区的修改，应该尽量在一开始规划好，不要后续去修改分区，对于其他引起 rebalance 的因素，也应该将其概率降到最低。

今天的分享就到这里，感谢你的观看，我们下期见，如果文中有说得不合理或者不正确的地方，希望你能进行指点，更多关于kafka rebalance负载均衡的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

java获取Date类型的年份实例代码
这篇文章主要给大家介绍了关于java如何获取Date类型的年份,针对java获取Date时间的各种方式汇总,有常用的时间获取方式,还有一些其他特殊时间获取方式,需要的朋友可以参考下
2024-06-06
SpringBoot根据注解动态执行类中的方法实现
本文主要介绍了SpringBoot根据注解动态执行类中的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-08-08
Java并发框架中的AQS详细解析
这篇文章主要介绍了Java并发框架中的AQS详细解析,之前说锁的升级的时候,说到了自旋锁会空转几次尝试等待获取资源,其实这一系列的动作是有一个规范的这个规范叫做同步发生器AbstractQueuedSynchronizer ,简称AQS,需要的朋友可以参考下
2024-01-01
初识Java8中的Stream
lambda表达式是stream的基础，接下来通过实例代码给大家详细介绍java8中的stream，感兴趣的朋友一起看看吧
2017-08-08
通过实例了解如何在JavaWeb实现文件下载
这篇文章主要介绍了通过实例了解如何在JavaWeb实现文件下载,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-09-09
SpringMVC执行步骤、Model的使用详解
这篇文章主要介绍了SpringMVC执行步骤、Model的使用详解，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-12-12
Java与Http协议的详细介绍
这篇文章主要介绍了Java与Http协议的详细介绍的相关资料,这里提供实例来帮助大家学习理解这部分内容，需要的朋友可以参考下
2017-09-09
idea 创建 maven web 工程流程(图文教程)
这篇文章主要介绍了idea 创建 maven web 工程流程(图文教程),小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-05-05
Java BeanMap实现Bean与Map的相互转换
这篇文章主要介绍了利用BeanMap进行对象与Map的相互转换,通过net.sf.cglib.beans.BeanMap类中的方法来转换，效率极高，本文给大家分享实现代码，感兴趣的朋友一起看看吧
2022-11-11
浅析JAVA 循环结构
这篇文章主要介绍了JAVA 循环结构的相关资料，文中讲解的非常细致，示例代码帮助大家更好的理解和学习，感兴趣的朋友可以了解下
2020-07-07