Python Playwright的使用详解

 更新时间:2022年10月14日 14:07:31   作者:梦想橡皮擦  
本篇博客为大家介绍一款新的自动化测试工具,效果类似 selenium,但是这个模块年轻。模块名称为 playwright-python,微软开源的,是针对 Python 语言的纯自动化工具,感兴趣的可以了解一下

实战场景

本篇博客为大家介绍一款新的自动化测试工具,效果类似 selenium,但是这个模块年轻。

模块名称为 playwright-python,微软开源的,是针对 Python 语言的纯自动化工具,可以通过 API 调用浏览器,github 地址在本文末尾。

接下来将通过 3 篇博客为大家详细介绍该 playwright-python,彻彻底底了解它。

正式开始前依旧是模块安装:

pip install playwright

该模块安装非常快,但完整体验还需要安装浏览器相关驱动,这个有点大,命令如下:

python -m playwright install

安装时注意使用国内源!

等待过程中,可以查阅输出日志,核对安装了哪些模块:

  • Downloading FFMPEG:FFMPEG;
  • Downloading Firefox 104.0:火狐浏览器驱动;
  • Downloading Chromium :谷歌浏览器驱动;
  • Downloading Webkit 16.0 :Webkit 浏览器驱动。

实战操作

第一次实战操作,先从不写代码开始,通过下述命令启动浏览器,然后【录制】我们的操作过程。

python -m playwright codegen

运行代码之后,弹出默认浏览器和一个代码录制展示框,具体如下所示:

下面就可以在左侧的浏览器窗口中进行操作,然后观察右侧自动生成的代码段。

在地址栏输入 baidu.com 跳转到百度首页,然后输入 航天员,点击搜索按钮,生成的代码如下所示。

将生成的代码复制到开发工具中,直接运行就可以得到刚刚相同的操作。

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    # Open new page
    page = context.new_page()
    # Go to https://www.baidu.com/
    page.goto("https://www.baidu.com/")
    # Click input[name="wd"]
    page.locator("input[name=\"wd\"]").click()
    # Fill input[name="wd"]
    page.locator("input[name=\"wd\"]").fill("航天员")
    # Press Enter
    page.locator("input[name=\"wd\"]").press("Enter")
    page.wait_for_url(
        "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E8%88%AA%E5%A4%A9%E5%91%98&fenlei=256&rsv_pq=0xfde7decb0011bfe6&rsv_t=3a67vLT%2Buti4VKw0mDppSrydbnq6CGsyOVNNxN%2F39naR6lYvxacuqvbYKRs0&rqlang=en&rsv_enter=1&rsv_dl=tb&rsv_sug3=24&rsv_sug1=24&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&prefixsug=%25E8%2588%25AA%25E5%25A4%25A9%25E5%2591%2598&rsp=5&inputT=5824&rsv_sug4=6786&rsv_jmp=fail")
    # ---------------------
    context.close()
    browser.close()

with sync_playwright() as playwright:
    run(playwright)

接下来我们分析一下其生成的代码含义。

from playwright.sync_api import Playwright, sync_playwright

playwright.sync_api 模块导入 Playwrightsync_playwright,看到关键字 sync,可以猜测这是一个同步操作,那与之对应的,也是未来我们要对比学习的,就是异步接口相关内容,这里先埋下一个伏笔,下篇博客在进行讨论。

browser = playwright.chromium.launch(headless=False)

初始化一个谷歌浏览器对象,并且不是无头浏览器,即在桌面打开浏览器窗口。launch() 方法包含很多参数,常用的有以下内容:

  • headless:是否为无头浏览器,即是否显示浏览器窗口,默认为不显示;
  • channel:浏览器版本,"chrome", "chrome-beta", "chrome-dev", "chrome-canary";
  • proxy:代理设置;
  • timeout:超时时间,默认 30s。
context = browser.new_context()
page = context.new_page()

打开一个新浏览器,创建一个新页面,其中 browser.new_context() 的参数都是与浏览器配置相关的内容,实践的时候需要特别设置的在这里设置,例如下述参数:

  • user_agent:UA 代理;
  • viewport:页面大小,比例,例 1024*768;
  • offline:离线模式加载。
page.goto("https://www.baidu.com/")
page.locator("input[name=\"wd\"]").click()
……
page.wait_for_url(……)
  • goto() :地址跳转,即浏览器跳转;
  • locator():定位元素;
  • wait_for_url():等待页面加载完毕。

本文末尾重点介绍一下 goto() 相关内容,剩余函数下篇博客继续说明。 goto() 函数的重要参数:

  • url:跳转地址,必须包含协议,例如 http:// 或者 https://
  • referer:请求头中的 referer 参数;
  • timeout:最大操作时间(毫秒),默认为 30 秒;
  • wait_until:默认操作成功时,执行的内容,还有几个事件,分别是 domcontentloadednetworkidlecommit

项目开源地址:https://github.com/microsoft/playwright-python

官方手册:https://playwright.dev/python/docs/intro

到此这篇关于Python Playwright的使用详解的文章就介绍到这了,更多相关Python Playwright内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python之用户输入的实例

    Python之用户输入的实例

    今天小编就为大家分享一篇Python之用户输入的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • python设置windows桌面壁纸的实现代码

    python设置windows桌面壁纸的实现代码

    每天换一个壁纸,每天好心情。喜欢的朋友可以参考下
    2013-01-01
  • Python文本的艺术字符串处理技巧掌握

    Python文本的艺术字符串处理技巧掌握

    这篇文章主要为大家介绍了Python文本的艺术字符串处理技巧掌握,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11
  • 解决python3.6用cx_Oracle库连接Oracle的问题

    解决python3.6用cx_Oracle库连接Oracle的问题

    这篇文章主要介绍了解决python3.6用cx_Oracle库连接Oracle的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • python使用代理IP爬取猫眼电影专业评分数据

    python使用代理IP爬取猫眼电影专业评分数据

    在编写爬虫程序的过程中,IP封锁无疑是一个常见且棘手的问题,尽管网络上存在大量的免费IP代理网站,但其质量往往参差不齐,令人堪忧,本篇文章中介绍一下如何使用Python的Requests库和BeautifulSoup库来抓取猫眼电影网站上的专业评分数据,需要的朋友可以参考下
    2024-03-03
  • python类继承与子类实例初始化用法分析

    python类继承与子类实例初始化用法分析

    这篇文章主要介绍了python类继承与子类实例初始化用法,实例分析了Python类的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-04-04
  • 在Python中计算移动平均值的方法

    在Python中计算移动平均值的方法

    在这篇文章中,我们将看到如何在Python中计算移动平均值,移动平均是指总观测值集合中固定大小子集的一系列平均值,它也被称为滚动平均,文中通过代码示例讲解的非常详细,需要的朋友可以参考下
    2024-10-10
  • python flask框架快速入门

    python flask框架快速入门

    Flask 本身相当于一个内核,其他几乎所有的功能都要用到扩展,都需要用第三方的扩展来实现,本文给大家分享如何快速入门python flask框架,感兴趣的朋友一起看看吧
    2021-05-05
  • Python 导入文件过程图解

    Python 导入文件过程图解

    这篇文章主要介绍了Python 导入文件过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10
  • Python PyYAML库解析YAML文件使用详解

    Python PyYAML库解析YAML文件使用详解

    这篇文章主要为大家介绍了Python PyYAML库解析YAML文件使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11

最新评论