Python+OpenCV实战之利用 K-Means 聚类进行色彩量化

更新时间：2021年12月03日 11:58:07 作者：盼小辉丶

这篇文章主要介绍了如何利用 K-Means 聚类进行色彩量化，以减少图像中颜色数量。文中的代码具有一定的学习价值，感兴趣的小伙伴可以关注一下

前言

K-Means 聚类算法的目标是将 n 个样本划分(聚类)为 K 个簇，在博文《OpenCV与机器学习的碰撞》中，我们已经学习利用 OpenCV 提供了 cv2.kmeans() 函数实现 K-Means 聚类算法，该算法通过找到簇的中心并将输入样本分组到簇周围，同时通过简单的示例了解了 K-Means 算法的用法。在本文中，我们将学习如何利用 K-Means 聚类进行色彩量化，以减少图像中颜色数量。

利用 K-Means 聚类进行色彩量化

色彩量化问题可以定义为减少图像中颜色数量的过程。色彩量化对于某些设备显示图像非常关键，这些设备可能由于内存限制等原因只能显示有限颜色，因此，在这些设备上显示色彩通常需要在准确性和减少颜色数量之间进行权衡，在利用 K-Means 聚类进行色彩量化时，权衡两者是通过正确设置 K 参数来进行的。

利用 K-Means 聚类算法来执行色彩量化，簇中心数据由 3 个特征组成，它们对应于图像每个像素的 B、G 和 R 值。因此，关键是将图像转换为数据：

data = np.float32(image).reshape((-1, 3))

为了观察如何权衡准确性和颜色数，我们使用不同 K 值 (3 、 5 、 10 、 20 和 40) 执行聚类过程，以查看生成的图像如何变化，如果我们想要只有 3 种颜色 (K = 3) 的结果图像，需要执行以下操作：

加载 BGR 图像：

img = cv2.imread('example.jpg')

使用 color_quantization() 函数执行色彩量化：

def color_quantization(image, k):
    # 将图像转换为数据
    data = np.float32(image).reshape((-1, 3))
    # 算法终止条件
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 20, 1.0)
    # K-Means 聚类
    ret, label, center = cv2.kmeans(data, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
    # 簇中心
    center = np.uint8(center)
    # 将具有 k 颜色中心的图像转换为 uint8
    result = center[label.flatten()]
    result = result.reshape(img.shape)
    return result
color_3 = color_quantization(img, 3)

color_quantization() 函数中，关键点是利用 cv2.kmeans() 方法。最后，可以用 k 种颜色来构建图像，用它们对应的中心值替换每个像素值，程序的运行结果如下所示：

完整代码

利用 K-Means 聚类进行色彩量化的完整代码如下所示：

import numpy as np
import cv2
from matplotlib import pyplot as plt


def show_img_with_matplotlib(color_img, title, pos):
    img_RGB = color_img[:, :, ::-1]

    ax = plt.subplot(2, 4, pos)
    plt.imshow(img_RGB)
    plt.title(title, fontsize=8)
    plt.axis('off')

def color_quantization(image, k):
    # 将图像转换为数据
    data = np.float32(image).reshape((-1, 3))
    # 算法终止条件
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 20, 1.0)
    # K-Means 聚类
    ret, label, center = cv2.kmeans(data, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
    # 簇中心
    center = np.uint8(center)
    # 将具有 k 颜色中心的图像转换为 uint8
    result = center[label.flatten()]
    result = result.reshape(img.shape)
    return result

fig = plt.figure(figsize=(16, 8))
plt.suptitle("Color quantization using K-means clustering algorithm", fontsize=14, fontweight='bold')
# 图片加载
img = cv2.imread('example.png')
show_img_with_matplotlib(img, "original image", 1)
# 使用不同 K 值进行色彩量化
for i in range(7):
    color = color_quantization(img, (i+1) * 10)
    show_img_with_matplotlib(color, "color quantization (k = {})".format((i+1) * 10), i+2)

plt.show()

显示色彩量化后的色彩分布

可以扩展以上程序使其显示色彩量化后的色彩分布，该色彩分布显示了分配给每个聚类中心的像素数。只需扩展 color_quantization() 函数已被修改为包含所需功能：

import collections
def color_quantization(image, k):
    # 将图像转换为数据
    data = np.float32(image).reshape((-1, 3))
    # 算法终止条件
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 20, 1.0)
    # K-Means 聚类
    ret, label, center = cv2.kmeans(data, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
    # 簇中心
    center = np.uint8(center)
    # 将具有 k 颜色中心的图像转换为 uint8
    result = center[label.flatten()]
    result = result.reshape(img.shape)
    # 统计分配给每个聚类中心的像素数
    counter = collections.Counter(label.flatten())
    print(counter)
    # 计算输入图像的总像素数
    total = img.shape[0] * img.shape[1]
    # 为色彩分布图像指定宽度和高度：
    desired_width = img.shape[1]
    
    desired_height = 70
    desired_height_colors = 50
    # 初始化色彩分布图像
    color_distribution = np.ones((desired_height, desired_width, 3), dtype='uint8') * 255
    start = 0

    for key, value in counter.items():
        # 归一化
        value_normalized = value / total * desired_width
        end = start + value_normalized
        # 绘制与当前颜色对应的矩形
        cv2.rectangle(color_distribution, (int(start), 0), (int(end), desired_height_colors), center[key].tolist(), -1)
        start = end

    return np.vstack((color_distribution, result))

上述代码中，使用 collections.Counter() 来统计分配给每个聚类中心的像素数：

counter = collections.Counter(label.flatten())

例如，如果 K = 10，则可以得到如下结果：

Counter({7: 37199, 3: 36302, 0: 29299, 5: 23987, 6: 23895, 1: 20077, 9: 19814, 8: 18427, 4: 16221, 2: 14779})

构建色彩分布图像后，将其与色彩量化后的图像连接在一起：

np.vstack((color_distribution, result))

程序的输出如下所示：

从上图可以看出，使用 K-Means 聚类算法应用色彩量化后改变参数 k (10、20、30、40、50、60 和 70) 的结果，k 值越大产生的图像越逼真。

Note：除了 color_quantization() 函数外，由于其他代码并未修改，因此不再另外给出。

到此这篇关于Python+OpenCV实战之利用 K-Means 聚类进行色彩量化的文章就介绍到这了,更多相关OpenCV K-Means 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

django的ORM操作增加和查询
这篇文章主要介绍了django的ORM操作增加和查询,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
浅谈dataframe中更改列属性的方法
今天小编就为大家分享一篇浅谈dataframe中更改列属性的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-07-07
常见python正则用法的简单实例
下面小编就为大家带来一篇常见python正则用法的简单实例。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2016-06-06
Python+pandas计算数据相关系数的实例
今天小编就为大家分享一篇Python+pandas计算数据相关系数的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-07-07
Python设置默认编码为utf8的方法
这篇文章主要介绍了Python设置默认编码为utf8的方法,结合实例形式分析了Python针对文件编码的设置方法与相关注意事项,需要的朋友可以参考下
2016-07-07
Python之进行URL编码案例讲解
这篇文章主要介绍了Python之进行URL编码案例讲解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
2021-08-08
python通过imaplib模块读取gmail里邮件的方法
这篇文章主要介绍了python通过imaplib模块读取gmail里邮件的方法,涉及Python操作imaplib模块操作邮件的相关技巧,需要的朋友可以参考下
2015-05-05
Python手动实现Hough圆变换的示例代码
Hough圆变换的原理相信大家都非常清楚了，但是手动实现的比较少。这篇文章将为大家介绍手动实现Hough圆变换的示例代码，需要的可以了解一下
2022-01-01
使用Python中的Argparse实现将列表作为命令行参数传递
Argparse 是一个 Python 库,用于以用户友好的方式解析命令行参数,本文我们将讨论如何使用 Python 中的 Argparse 库将列表作为命令行参数传递,感兴趣的可以了解下
2023-08-08
使用pyscript在网页中撰写Python程式的方法
本文主要介绍了使用pyscript在网页中撰写Python程式的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-05-05