python利用Appium实现自动控制移动设备并提取数据功能

 更新时间:2021年09月02日 10:28:40   作者:ZSYL  
这篇文章主要介绍了python利用Appium自动控制移动设备并提取数据,本文以控制抖音app滑动并获取抖音短视频发布者为例,通过实例代码给大家介绍的非常详细,需要的朋友可以参考下

以控制抖音app滑动并获取抖音短视频发布者昵称和点赞数等信息为例:

在这里插入图片描述

1. 安装appium-python-client模块并启动已安装好的环境

 1.1 安装appium-python-client模块

window的虚拟环境下执行pip install appium-python-client

1.2 启动夜神模拟器

进入夜神模拟器所在的安装路径的bin目录下,进入cmd终端,使用adb命令建立adb server和模拟器的连接

1.adb devices

C:\Program Files (x86)\Nox\bin>adb devices
List of devices attached
* daemon not running; starting now at tcp:5037
* daemon started successfully

2.nox_adb.exe connect 127.0.0.1:62001

C:\Program Files (x86)\Nox\bin>nox_adb.exe connect 127.0.0.1:62001
already connected to 127.0.0.1:62001

3.adb devices

C:\Program Files (x86)\Nox\bin>adb devices
List of devices attached
127.0.0.1:62001 device

1.3 启动appium-desktop

点击start server启动appium服务

[Appium] Welcome to Appium v1.10.0
[Appium] Appium REST http interface listener started on 0.0.0.0:4723

1.4 利用上一小节所学习的内容获取Desired Capabilities参数

1.获取模拟设备的型号

  •  打开设置——关于平板电脑
  • 查看型号,获取模拟设备的型号

2.获取app包名称 以及 app进程名

  • 打开模拟器中的抖音短视频app
  • 在adb连接正确的情况下,在夜神模拟器安装目录的bin目录下的cmd中输入adb shell
  • 进入adb shell后输入 dumpsys activity | grep mFocusedActivity
  • ``com.ss.android.ugc.aweme`就是app包名
  • .main.MainActivity就是进程名 注意前边有个点.

2. 初始化以及获取移动设备分辨率

完成代码如下,并运行代码查看效果:如果模拟器中抖音app被启动,并打印出模拟设备的分辨率则成功

from appium import webdriver

# 初始化配置,设置Desired Capabilities参数
desired_caps = {
    'platformName': 'Android',
    'deviceName': 'SM-G955F',
    'appPackage': 'com.ss.android.ugc.aweme',
    'appActivity': '.main.MainActivity'
}
# 指定Appium Server
server = 'http://localhost:4723/wd/hub'
# 新建一个driver
driver = webdriver.Remote(server, desired_caps)
# 获取模拟器/手机的分辨率(px)
width = driver.get_window_size()['width']
height = driver.get_window_size()['height']
print(width, height)

移动设备分辨率

  • driver.get_window_size()[‘width']
  • driver.get_window_size()[‘height']

3. 定位元素以及提取文本的方法

3.1 点击appium desktop右上角的放大镜图标

如图填写配置,并点击start session

在这里插入图片描述

3.2 定位界面的使用方法如下图所示

在这里插入图片描述

3.3 点击短视频的作者名字,查看并获取该元素的id

在这里插入图片描述

3.4 在python使用代码通过元素id获取该元素的文本内容

实例化appium driver对象后添加如下代码,运行并查看效果

# 获取视频的各种信息:使用appium desktop定位元素
print(driver.find_element_by_id('bc').text)  # 发布者名字
print(driver.find_element_by_id('al9').text)  # 点赞数
print(driver.find_element_by_id('al_').text)  # 留言数
print(driver.find_element_by_id('a23').text)  # 视频名字,可能不存在,报错

定位元素及获取其文本内容的方法

  • driver.find_element_by_id(元素的id).text
  • driver.find_element_by_xpath(定位元素的xpath规则).text

4. 控制抖音app滑动

4.1 appium滑动的函数

从(start_x, start_y)滑动到(end_x, end_y)

driver.swipe(start_x, start_y, end_x, end_y) 4.2 控制抖音app滑动的代码实现

start_x = width // 2  # 滑动的起始点的x坐标,屏幕宽度中心点
start_y = height // 3 * 2  # 滑动的起始点的y坐标,屏幕高度从上开始到下三分之二处
distance = height // 2  # y轴滑动距离:屏幕高度一半的距离
end_x = start_x # 滑动的终点的x坐标
end_y = start_y-distance # 滑动的终点的y坐标
# 滑动
driver.swipe(start_x, start_y, end_x, end_y)

5. 整理并完成自动滑动的代码

import time
from appium import webdriver

class DouyinAction():
    """自动滑动,并获取抖音短视频发布者的id"""
    def __init__(self, nums:int=None):
        # 初始化配置,设置Desired Capabilities参数
        self.desired_caps = {
            'platformName': 'Android',
            'deviceName': 'SM-G955F',
            'appPackage': 'com.ss.android.ugc.aweme',
            'appActivity': '.main.MainActivity'
        }
        # 指定Appium Server
        self.server = 'http://localhost:4723/wd/hub'
        # 新建一个driver
        self.driver = webdriver.Remote(self.server, self.desired_caps)
        # 获取模拟器/手机的分辨率(px)
        width = self.driver.get_window_size()['width']
        height = self.driver.get_window_size()['height']
        print(width, height)
        # 设置滑动初始坐标和滑动距离
        self.start_x = width//2 # 屏幕宽度中心点
        self.start_y = height//3*2 # 屏幕高度从上开始到下三分之二处
        self.distance = height//2 # 滑动距离:屏幕高度一半的距离
        # 设置滑动次数
        self.nums = nums

    def comments(self):
        # app开启之后点击一次屏幕,确保页面的展示
        time.sleep(2)
        self.driver.tap([(500, 1200)], 500)

    def scroll(self):
        # 无限滑动
        i = 0
        while True:
            # 模拟滑动
            print('滑动ing...')
            self.driver.swipe(self.start_x, self.start_y,
                              self.start_x, self.start_y-self.distance)
            time.sleep(1)
            self.get_infos() # 获取视频发布者的名字
            # 设置延时等待
            time.sleep(4)
            # 判断是否退出
            if self.nums is not None and self.nums == i:
                break
            i += 1

    def get_infos(self):
        # 获取视频的各种信息:使用appium desktop定位元素
        print(self.driver.find_element_by_id('bc').text) # 发布者名字
        print(self.driver.find_element_by_id('al9').text) # 点赞数
        print(self.driver.find_element_by_id('al_').text) # 留言数
        print(self.driver.find_element_by_id('a23').text) # 视频名字,可能不存在,报错

        # # 点击【分享】坐标位置 671,1058
        # self.driver.tap([(671, 1058)])
        # time.sleep(2)
        # # 向左滑动露出 【复制链接】 580,1100 --> 200, 1100
        # self.driver.swipe(580,1100, 20, 200, 1100)
        # # self.driver.get_screenshot_as_file('./a.png') # 截图
        # # 点击【复制链接】 距离右边60 距离底边170 720-60,1280-170
        # self.driver.tap([(660, 1110)])
        # # self.driver.get_screenshot_as_file('./b.png')  # 截图

    def main(self):
        self.comments() # 点击一次屏幕,确保页面的展示
        time.sleep(2)
        self.scroll() # 滑动


if __name__ == '__main__':

    action = DouyinAction(nums=5)
    action.main()

至此,可以参考爬虫5.0课程项目库,使用fiddler等抓包工具,利用appium+mitmproxy+wget等python模块自动获取抖音视频文件

6. 关于模拟式移动端爬虫的参考阅读

https://github.com/butomo1989/docker-android

https://blog.csdn.net/weixin_42620645/article/details/83828863

https://blog.csdn.net/weixin_39211232/article/details/83410130#Android_16

https://www.jianshu.com/p/bf1ca3d4ac76

http://www.testclass.net/appium/

小结

了解 appium-python-client模块定位元素以及提取其文本内容的方法了解 appium-python-client模块控制滑动动作的方法 7. 完整代码

douyin.py

import time
from appium import webdriver

class DouyinAction():
    """自动滑动,并获取抖音短视频发布者的id"""
    def __init__(self, nums:int=None):
        # 初始化配置,设置Desired Capabilities参数
        self.desired_caps = {
            'platformName': 'Android',
            'deviceName': 'SM-G955F',
            'appPackage': 'com.ss.android.ugc.aweme',
            'appActivity': '.main.MainActivity'
        }
        # 指定Appium Server
        self.server = 'http://localhost:4723/wd/hub'
        # 新建一个driver
        self.driver = webdriver.Remote(self.server, self.desired_caps)
		
        # 获取模拟器/手机的分辨率(px)
        width = self.driver.get_window_size()['width']
        height = self.driver.get_window_size()['height']
        print(width, height)
        # 设置滑动初始坐标和滑动距离
        self.start_x = width//2 # 屏幕宽度中心点
        self.start_y = height//3*2 # 屏幕高度从上开始到下三分之二处
        self.distance = height//2 # 滑动距离:屏幕高度一半的距离
        # 设置滑动次数
        self.nums = nums

    def comments(self):
        # app开启之后点击一次屏幕,确保页面的展示
        time.sleep(2)
        self.driver.tap([(500, 1200)], 500)

    def scroll(self):
    
        print('滑动ing...')
        self.driver.swipe(self.start_x, self.start_y,
                          self.start_x, self.start_y-self.distance)
        time.sleep(3)
        self.driver.find_element_by_xpath('/hierarchy/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.widget.FrameLayout/android.widget.HorizontalScrollView/android.widget.LinearLayout/android.widget.TabHost/android.widget.FrameLayout/android.widget.FrameLayout[2]/android.widget.LinearLayout/android.widget.FrameLayout[1]').click()
        time.sleep(3)
        # 无限滑动
        i = 0
        while True:
            # 模拟滑动
            print('滑动ing...')
            self.driver.swipe(self.start_x, self.start_y,
                              self.start_x, self.start_y-self.distance)
            time.sleep(3)
            self.get_infos() # 获取视频发布者的名字
            # 设置延时等待
            time.sleep(4)
            # 判断是否退出
            if self.nums is not None and self.nums == i:
                break
            i += 1

    def get_infos(self):
        
        # 获取视频的各种信息:使用appium desktop定位元素
        print(self.driver.find_element_by_id('ap').text) # 发布者名字
        print(self.driver.find_element_by_id('xm').text) # 点赞数
        print(self.driver.find_element_by_id('xn').text) # 留言数
        print(self.driver.find_element_by_id('oz').text) # 视频名字,可能不存在,报错

        # # 点击【分享】坐标位置 671,1058
        # self.driver.tap([(671, 1058)])
        # time.sleep(2)
        # # 向左滑动露出 【复制链接】 580,1100 --> 200, 1100
        # self.driver.swipe(580,1100, 20, 200, 1100)
        # # self.driver.get_screenshot_as_file('./a.png') # 截图
        # # 点击【复制链接】 距离右边60 距离底边170 720-60,1280-170
        # self.driver.tap([(660, 1110)])
        # # self.driver.get_screenshot_as_file('./b.png')  # 截图

    def main(self):
        self.comments() # 点击一次屏幕,确保页面的展示
        time.sleep(2)
        self.scroll() # 滑动


if __name__ == '__main__':

    action = DouyinAction(nums=5)
    action.main()

到此这篇关于python利用Appium自动控制移动设备并提取数据的文章就介绍到这了,更多相关python Appium提取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Httprunner简介、安装及基本使用教程

    Httprunner简介、安装及基本使用教程

    httprunner是一款面向 HTTP(S) 协议的通用测试框架。只需编写维护一份 YAML/JSON 脚本,即可实现自动化测试、性能测试、线上监控、持续集成等多种测试需求,本文给大家介绍Httprunner安装使用教程,感兴趣的朋友一起看看吧
    2022-02-02
  • Python用K-means聚类算法进行客户分群的实现

    Python用K-means聚类算法进行客户分群的实现

    这篇文章主要介绍了Python用K-means聚类算法进行客户分群的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • python中自定义with的具体使用

    python中自定义with的具体使用

    在 Python 中,with 语句用于简化资源管理,它保证在执行完代码块后正确地释放资源,通过__enter__和__exit__魔术方法实现,本文就来详细的介绍一下,感兴趣的可以了解一下
    2024-09-09
  • 使用Python的Zato发送AMQP消息的教程

    使用Python的Zato发送AMQP消息的教程

    这篇文章主要介绍了使用Python的Zato发送AMQP消息的教程,主要是基于一些Zato的图形化界面进行操作,需要的朋友可以参考下
    2015-04-04
  • 使用python获取cpu每秒的使用率

    使用python获取cpu每秒的使用率

    这篇文章主要介绍了使用python获取cpu每秒的使用率,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • Python初学者必须掌握的25个内置函数详解

    Python初学者必须掌握的25个内置函数详解

    这篇文章主要介绍了Python25个常用内置函数总结,本文罗列了数学相关 、功能相关、类型转换、字符串处理、序列处理函数等常用内置函数,需要的朋友可以参考下
    2021-09-09
  • 520使用Python实现“我爱你”表白

    520使用Python实现“我爱你”表白

    这篇文章主要介绍了520使用Python实现“我爱你”表白,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-05-05
  • Python验证的50个常见正则表达式

    Python验证的50个常见正则表达式

    这篇文章主要给大家介绍了关于利用Python验证的50个常见正则表达式的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 解析目标检测之IoU

    解析目标检测之IoU

    Intersection over Union(IoU)是一种测量在特定数据集中检测相应物体准确度的一个标准。IoU是一个简单的测量标准,只要是在输出中得出一个预测范围(bounding boxes)的任务都可以用IoU来进行测量
    2021-06-06
  • 使用scipy.optimize的fsolve,root函数求解非线性方程问题

    使用scipy.optimize的fsolve,root函数求解非线性方程问题

    这篇文章主要介绍了使用scipy.optimize的fsolve,root函数求解非线性方程问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12

最新评论