python识别图标并点击功能实现

 更新时间:2024年07月04日 11:00:20   作者:一晌小贪欢  
这篇文章主要介绍了python识别图标并点击功能实现,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧

python识别图标并点击

首相片帖子已经重复的太多了,我试一下感觉还是很好用的,我就是记录一下 这篇帖子可以直接制作出很多自动点击的工具,甚至是游戏物理辅助工具(因为我就在用)! 视频展示

在这里插入图片描述

安装作用
pillowpip install pillow 加载图片
pyscreezepip install pyscreeze截屏
pyautoguipip install pyautogui 控制鼠标或键盘
opencv-pythonpip install opencv-python==4.3.0.38识别匹配图片
import time
import pyautogui
import pyscreeze
import cv2
# 屏幕缩放系数 mac缩放是2 windows一般是1
screenScale=1
#事先读取按钮截图
target= cv2.imread(r"./image/ssk.png",cv2.IMREAD_GRAYSCALE)
# 先截图
screenshot=pyscreeze.screenshot('my_screenshot.png')
# 读取图片 灰色会快
temp = cv2.imread(r'my_screenshot.png',cv2.IMREAD_GRAYSCALE)
theight, twidth = target.shape[:2]
tempheight, tempwidth = temp.shape[:2]
print("目标图宽高:"+str(twidth)+"-"+str(theight))
print("模板图宽高:"+str(tempwidth)+"-"+str(tempheight))
# 先缩放屏幕截图 INTER_LINEAR INTER_AREA
scaleTemp=cv2.resize(temp, (int(tempwidth / screenScale), int(tempheight / screenScale)))
stempheight, stempwidth = scaleTemp.shape[:2]
print("缩放后模板图宽高:"+str(stempwidth)+"-"+str(stempheight))
# 匹配图片
res = cv2.matchTemplate(scaleTemp, target, cv2.TM_CCOEFF_NORMED)
mn_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
if(max_val>=0.9):
    # 计算出中心点
    top_left = max_loc
    bottom_right = (top_left[0] + twidth, top_left[1] + theight)
    tagHalfW=int(twidth/2)
    tagHalfH=int(theight/2)
    tagCenterX=top_left[0]+tagHalfW
    tagCenterY=top_left[1]+tagHalfH
    #左键点击屏幕上的这个位置
    pyautogui.click(tagCenterX,tagCenterY,button='left') # 点击
else:
    print ("没找到")

补充:python 根据图片特征识别点击

python 根据图片特征识别点击

import cv2
import numpy as np
import pyautogui
import time
class ImageClicker:
    def __init__(self, target_image_path, retry_count=3, retry_interval=1, match_threshold=0.75):
        self.target_image_path = target_image_path
        self.retry_count = retry_count
        self.retry_interval = retry_interval
        self.match_threshold = match_threshold
        # 加载目标图片
        self.target_image = cv2.imread(self.target_image_path)
        # 提取目标图片的 SIFT 特征
        self.sift = cv2.SIFT_create()
        self.kp1, self.des1 = self.sift.detectAndCompute(self.target_image, None)
    def click_image(self):
        for i in range(self.retry_count):
            try:
                # 获取浏览器窗口截图
                screenshot = pyautogui.screenshot()
                screenshot = cv2.cvtColor(np.array(screenshot), cv2.COLOR_RGB2BGR)
                # 提取截图的 SIFT 特征
                kp2, des2 = self.sift.detectAndCompute(screenshot, None)
                # 进行特征匹配
                bf = cv2.BFMatcher()
                matches = bf.knnMatch(self.des1, des2, k=2)
                # 使用 Lowe's Ratio Test 筛选匹配结果
                good = []
                for m, n in matches:
                    if m.distance < self.match_threshold * n.distance:  # 使用 match_threshold 阈值
                        good.append([m])
                # 计算目标元素的位置
                if len(good) > 0:
                    src_pts = np.float32([self.kp1[m[0].queryIdx].pt for m in good]).reshape(-1, 1, 2)
                    dst_pts = np.float32([kp2[m[0].trainIdx].pt for m in good]).reshape(-1, 1, 2)
                    M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)
                    h, w = self.target_image.shape[:2]
                    pts = np.float32([[0, 0], [0, h - 1], [w - 1, h - 1], [w - 1, 0]]).reshape(-1, 1, 2)
                    dst = cv2.perspectiveTransform(pts, M)
                    # 计算点击坐标
                    x = int((dst[0][0][0] + dst[2][0][0]) / 2)  # 计算水平方向的中间位置
                    y = int((dst[0][0][1] + dst[2][0][1]) / 2)  # 计算垂直方向的中间位置
                    # 点击目标元素
                    pyautogui.click(x, y)
                    return True  # 点击成功
            except Exception as e:
                print(f"点击失败:{e}")
                time.sleep(self.retry_interval)
        return False  # 点击失败
# 使用示例
image_clicker = ImageClicker('4.png', retry_count=5,
                             retry_interval=2,
                             match_threshold=0.8)  # 设置 match_threshold 为 0.8
if image_clicker.click_image():
    print("点击成功!")
else:
    print("点击失败!")

代码结构:

1.导入库:

  • cv2 (OpenCV):用于图像处理、特征提取和匹配的库。
  • numpy:用于处理图像数据所需的数值运算。
  • pyautogui:用于控制鼠标和键盘,模拟点击操作。
  • time:用于控制代码执行的暂停时间。

2.ImageClicker 类

__init__(self, target_image_path, retry_count=3, retry_interval=1, match_threshold=0.75)

初始化类,设置一些参数:

  • target_image_path:目标图像的路径。
  • retry_count:如果点击失败,重试的次数。
  • retry_interval:两次重试之间的间隔时间(秒)。
  • match_threshold:匹配阈值,用于判断目标图像与屏幕截图的匹配程度。值越高,匹配要求越严格。

加载目标图像 self.target_image

创建 SIFT (尺度不变特征变换) 对象 self.sift,用于提取图像特征。

计算目标图像的 SIFT 特征 self.kp1, self.des1

2.click_image(self)

1.循环尝试 retry_count 次:

  • 获取屏幕截图 screenshot。将截图转换为 OpenCV 格式。提取截图的 SIFT 特征 kp2, des2
  • 使用 cv2.BFMatcher 进行特征匹配,得到匹配结果 matches。使用 Lowe's Ratio Test 筛选匹配结果,得到 good 匹配列表。
  • 如果找到匹配结果:
    • 计算目标元素的位置(点击坐标)。
    • 使用 pyautogui.click() 模拟点击操作。
    • 返回 True,表示点击成功。

如果没有找到匹配结果,则等待 retry_interval 秒后继续尝试。

如果所有尝试都失败,则返回 False,表示点击失败。

使用方法:

  • 创建 ImageClicker 对象,传入目标图像路径和其他参数。
  • 调用 click_image() 方法尝试点击目标图像。

代码示例:

image_clicker = ImageClicker('4.png', retry_count=5, retry_interval=2, match_threshold=0.8)
if image_clicker.click_image():
    print("点击成功!")
else:
    print("点击失败!")

代码主要流程:

  • 加载目标图像并提取其 SIFT 特征。
  • 获取屏幕截图并提取其 SIFT 特征。
  • 将目标图像的特征与截图的特征进行匹配。
  • 使用 Lowe's Ratio Test 筛选匹配结果。
  • 计算目标元素的位置(点击坐标)。
  • 模拟点击目标元素。

注意:

  • 为了使代码正常运行,需要安装必要的库:opencv-pythonpyautogui
  • 确保目标图像 4.png 存在于代码所在的目录中。
  • 调整 match_threshold 值可以改变匹配的严格程度。
  • 为了避免误点击,可以根据实际情况调整 retry_count 和 retry_interval

参考资料:

python OpenCV 库中的 cv2.Canny() 函数来对图像进行边缘检测,并显示检测到的边缘特征

python 窗口化展示图片的 SIFT 特征

到此这篇关于python识别图标并点击的文章就介绍到这了,更多相关python识别图标内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python与Node.js之间实现通信的JSON数据接收发送

    Python与Node.js之间实现通信的JSON数据接收发送

    Python和Node.js是两个流行且功能强大的编程语言,它们之间使用JSON格式进行数据交换是一种高效和灵活的方式,本文将详细介绍如何在Python和Node.js之间通过JSON进行数据通信,包括发送和接收JSON数据以及一些常见的交互示例代码
    2024-01-01
  • 实用自动化运维Python脚本分享

    实用自动化运维Python脚本分享

    今天小编就为大家分享一篇实用自动化运维Python脚本。具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • 通过实例解析python and和or使用方法

    通过实例解析python and和or使用方法

    这篇文章主要介绍了通过实例解析python and和or使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • python3.9和pycharm的安装教程并创建简单项目的步骤

    python3.9和pycharm的安装教程并创建简单项目的步骤

    这篇文章主要介绍了python3.9和pycharm的安装教程并创建简单项目的步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • Python从函数参数类型引出元组实例分析

    Python从函数参数类型引出元组实例分析

    这篇文章主要介绍了Python从函数参数类型引出元组,结合实例形式分析了Python函数定义与使用中常见的三种参数类型,并简单分析了元组类型参数的使用,需要的朋友可以参考下
    2019-05-05
  • Python经典题实战记录之百元买百鸡

    Python经典题实战记录之百元买百鸡

    有一道著名的"百钱买百鸡"问题大家应该都不陌生,这篇文章主要给大家介绍了关于Python经典题实战记录之百元买百鸡的相关资料,文中给出了详细的代码示例,需要的朋友可以参考下
    2023-12-12
  • 基于Python实现视频转字符画动漫小工具

    基于Python实现视频转字符画动漫小工具

    大家都知道视频就是一帧一帧的图片构成的。那么想要实现将视频转换为字符画,就要将一部视频全部逐帧拆解成图片,然后采取和以前相同的将图片转换为字符画的算法即可。本文将详细为大家介绍如何实现,需要的可以参考一下
    2021-12-12
  • TensorFlow的环境配置与安装教程详解(win10+GeForce GTX1060+CUDA 9.0+cuDNN7.3+tensorflow-gpu 1.12.0+python3.5.5)

    TensorFlow的环境配置与安装教程详解(win10+GeForce GTX1060+CUDA 9.0+cuDNN7

    这篇文章主要介绍了TensorFlow的环境配置与安装(win10+GeForce GTX1060+CUDA 9.0+cuDNN7.3+tensorflow-gpu 1.12.0+python3.5.5),本文通过图文并茂的形式给大家介绍的非常详细,需要的朋友可以参考下
    2020-06-06
  • 浅析Python与Java和C之间有哪些细微区别

    浅析Python与Java和C之间有哪些细微区别

    这篇文章主要介绍了Python与Java和C之间有哪些细微区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • Python实现个人微信号自动监控告警的示例

    Python实现个人微信号自动监控告警的示例

    今天小编就为大家分享一篇Python实现个人微信号自动监控告警的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07

最新评论