【Playwright+Python】系列教程（二）手把手带你写一个脚本

2024-06-24 22:22 由久曲健发表于 #后端开发

一、如何使用代理方式打开网页

在 playwright.chromium.launch() 中传入 proxy 参数即可，示例代码如下：

1、同步写法：

from playwright.sync_api import sync_playwright

proxy = {'server': 'http:/127.0.0.1:8080'}


def run():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False, proxy=proxy)
        page = browser.new_page()

        page.goto('https://www.baidu.com')

        title = page.title()
        if "百度" in title:
            print("打开百度成功")
        else:
            print("打开百度失败")

        browser.close()


run()

2、异步写法：

from playwright.async_api import async_playwright
import asyncio

proxy = {'server': 'http:/127.0.0.1:8080'}


async def run():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False, proxy=proxy)
        page = await browser.new_page()

        await page.goto('https://www.baidu.com')

        title = await page.title()
        if "百度" in title:
            print("打开百度成功")
        else:
            print("打开百度失败")

        await browser.close()


asyncio.get_event_loop().run_until_complete(run())

二、同步和异步写法对比

1、同步的优点:

代码结构简单易懂,不需要学习async/await语法
适用于小规模或简单任务
调试和理解同步代码更简单

2、异步的优点:

能更高效地利用系统资源,避免阻塞等待IO
对于长时间操作如网络请求更高效
可以支持并发执行多个任务
对于大规模和复杂系统更有利

3、区别

对于小任务和学习用途,同步代码结构更简单。
对于需要长时间IO等待的任务(如网络请求),使用异步可以更高效。
对于需要支持高并发的系统(如网站),使用异步模型可以支持更多并发连接。
多线程同步会带来锁的问题,而异步避免了锁的使用。
异步的FUTURE模式也更易于扩展性好,支持动态增加回调函数。

4、总结

小任务用同步
长时间IO任务用异步
高并发系统用异步
以后的功能扩展考虑异步更灵活

一般来说对于现代化系统,异步编程模型将是主流趋势。但同步在某些场景也同样易用。选择时要根据具体需求来权衡。

三、写一个用例

1、示例脚本

算是个入门的例子，关于每句话的意思，看我注释即可，示例代码如下：

import re
from playwright.sync_api import Page, expect, sync_playwright

proxy = {'server': 'http://127.0.0.1:8080'}


def test_baidu():
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False, proxy=proxy)
        page = browser.new_page()
        # 跳转到baidu页面
        page.goto("https://www.baidu.com/")
        # 点击输入框
        page.locator("#kw").click()
        # 输入框输入selenium
        page.locator("#kw").fill("selenium")
        # 点击百度一下查询按钮
        page.get_by_role("button", name="百度一下").click()
        # 验证输入框是否输入selenium
        expect(page.locator("#kw")).to_have_value("selenium")
        # 验证页面是否包含文本“大家还在搜”
        expect(page.locator("#content_left")).to_contain_text("大家还在搜")
        # 退出浏览器
        browser.close()

注意：
测试类和测试方法都要用test_ 前缀命名

2、基本操作

这是 Playwright 常用操作列表，请注意，还有许多其他操作，请务必查看定位器 API 部分以了解更多相关信息。

操作	描述
locator.check()	选中输入复选框
locator.click()	点击元素
locator.uncheck()	取消选中输入复选框
locator.hover()	将鼠标悬停在元素上
locator.fill()	填写表单字段，输入文本
locator.focus()	聚焦元素
locator.press()	按下单个键
locator.set_input_files()	选择要上传的文件
locator.select_option()	从下拉菜单中选择选项

3、断言操作

断言	描述
expect(locator).to_be_checked()	复选框处于选中状态
expect(locator).to_be_enabled()	控件已启用
expect(locator).to_be_visible()	元素可见
expect(locator).to_contain_text()	元素包含文本
expect(locator).to_have_attribute()	元素具有属性
expect(locator).to_have_count()	元素列表已给出长度
expect(locator).to_have_text()	元素匹配文本
expect(locator).to_have_value()	输入元素具有值
expect(page).to_have_title()	页面有标题
expect(page).to_have_url()	页面有 URL

4、fixtures夹具的使用

示例代码：

import pytest
from playwright.sync_api import Page, expect, sync_playwright


@pytest.fixture(scope="function", autouse=True)
def before_each_after_each(page: Page):
    print("before the test runs")

    page.goto("https://www.baidu.com/")
    yield

    print("after the test runs")


def test_main_navigation(page: Page):
    page.locator("#kw").fill("久曲健 博客园")
    page.get_by_role("button", name="百度一下").click()
    expect(page.locator("#content_left")).to_contain_text("久曲健 - 博客园")

代码解释：

定义了一个名为 before_each_after_each 的 fixture（夹具），它的作用域是每个测试函数，并且设置为自动应用于每个测试函数。
在这个 fixture 中：打印 "before the test runs"，表示测试运行前执行的操作。使用 page.goto("https://www.baidu.com/") 打开百度首页。
yield 关键字在这个 fixture 运行期间挂起，等待测试函数执行。测试函数将在 fixture 的环境下执行。

热门相关：惊悚乐园美漫大幻想我拍戏不在乎票房家教哥哥来我家宠宠欲恋

【Playwright+Python】系列教程（一）环境搭建及脚本录制

一、前言看到这个文章，有的同学会说：六哥，你为啥不早早就写完python系列的文章。因为有徒弟需要吧，如果你也想学自学，那这篇文章，可以说是我们结缘一起学习的开始吧！如果对你有用，建议收藏和转发！二、Playwright是什么？微软开源自动化测试工具Playwright，支持主流浏览器， ...阅读全文

FPGA对EEPROM驱动控制（I2C协议）

本文摘要：本文首先对I2C协议的通信模式和AT24C16-EEPROM芯片时序控制进行分析和理解，设计了一个i2c通信方案。人为按下写操作按键后，FPGA（Altera EP4CE10）对EEPROM指定地址写入字节数据，并接后按下读操作按键，读取该地址上的一个字节数据在数码管低两位显示出来。其中包 ...阅读全文

Java8 Consumer、Supplier、Predicate、Function

今天我们还讲讲Consumer、Supplier、Predicate、Function这几个接口的用法，在 Java8 的用法当中，这几个接口虽然没有明目张胆的使用，但是，却是润物细无声的。为什么这么说呢？这几个接口都在 java.util.function 包下的，分别是Consumer（消费型） ...阅读全文

架构师必知的11种API性能优化方法

前言接口性能优化是后端开发人员经常碰到的一道面试题，因为它是一个跟开发语言无关的公共问题。这个问题既可以很简单，也可以相当复杂。有时候，只需要添加一个索引就能解决。有时候，代码需要进行重构。有时候，必须增加缓存。有时候，需要引入一些中间件，例如消息队列（MQ）。有时候，需进行分库分表。 ...阅读全文

【日记】上班居然睡了一上午（230 字）

正文昨天色到了很晚，早上没什么精神，于是睡了一个上午。在监控下面睡，只能说不愧是我。高中练就的无痕上课睡觉绝技居然在上班时也能派上用场。反洗钱系统今天卡到爆炸，这部分工作只能明天再做了。下午写了一篇文章。今天似乎也没做什么呢。晚上很想好好地在舞蹈室里练习，但老师总是想去街上跳，于是有限的场 ...阅读全文

Kotlin 编程语言详解：特点、应用领域及语法教程

**Kotlin**是JetBrains于2016年推出的编程语言，兼容Java，广泛用于移动（尤其是Android）、Web、服务器及数据科学。它的语法简洁安全，支持多平台，学习曲线平缓，且拥有活跃的社区。`main()`函数是程序入口，`println()`用于输出，而`print()`不换行。... ...阅读全文

【解决方案】Java 互联网项目中消息通知系统的设计与实现（上）

消息通知系统（notification-system）作为一个独立的微服务，完整地负责了 App 端内所有消息通知相关的后端功能实现。该系统既需要与文章系统、订单系统、会员系统等相关联，也需要和其它业务系统相关联，是一个偏底层的通用服务系统。 ...阅读全文

C++11智能指针 unique_ptr、shared_ptr/weak_ptr、make_shared、循环引用、定制删除器

目录智能指针场景引入 - 为什么需要智能指针？内存泄漏什么是内存泄漏内存泄漏的危害内存泄漏分类如何避免内存泄漏智能指针的使用及原理RAII简易例程智能指针的原理智能指针的拷贝问题智能指针的发展历史std::auto_ptr模拟实现auto_ptr例程:这种方案存在的问题:Boost库中的智能指针un ...阅读全文

PHP 程序员转 Go 语言的经历分享

大家好，我是码农先森。之前有朋友让我分享从 PHP 转 Go 的经历，这次它来了。我主要从模仿、进阶、应用这三个方面来描述转 Go 的经历及心得。模仿是良好的开端，进阶是艰难的成长，应用是认知的提升。希望我的经历对大家能有所启发。模仿著名艺术家毕加索说过「模仿是人类一切学习的开端，然后才是创新 ...阅读全文

BookKeeper 介绍(2)--安装

本文主要介绍 Bookkeeper 的安装，文中所使用到的软件版本：Java 1.8.0_321、BookKeeper 4.16.5、CentOS 7.9.2009。 1、单机安装官网(https://bookkeeper.apache.org/releases)下载安装包并解压： tar zxv ...阅读全文