有可以做web自动化测试的智能体么

有的,而且可以按“智能程度”和“落地难度”分几档来选。下面给你几种可用于 web 自动化测试的“智能体/方案”,从易到难:

1)AI 辅助写脚本(最容易上手)

  • 用法:让 AI 生成 Playwright/Selenium 的测试代码,你只需要提供页面元素/测试目标。
  • 智能体形态:通常是“聊天 + 代码生成/修复”。
  • 优点:稳定、可控、成本低、最适合尽快做出测试集。

常见工具栈:

  • Playwright(推荐)+ OpenAI/Claude 等模型做“代码生成/修复”
  • 流程:AI 根据你描述的场景 → 输出 Playwright 用例 → 你运行 → 失败后把报错/截图发回 AI 让它改代码。

2)AI 直接“驱动浏览器找元素”(较智能)

  • 用法:把测试任务写成自然语言,例如“点击登录→输入账号密码→断言用户名出现”,智能体尝试推断页面操作。
  • 优点:更接近你说的“智能体”
  • 注意:这类通常基于视觉/DOM语义或 LLM agent,有时对页面复杂度敏感(需要一定工程封装和稳定化策略)。

3)LLM + E2E 测试框架的“自愈智能体”(工程化更强)

  • 用法:失败后自动做:
    • 定位失败原因(超时/元素不可见/断言失败)
    • 重新定位 locator(用替代选择器)
    • 重新执行或最小化回滚
  • 优点:维护成本显著下降,适合持续集成(CI)
  • 缺点:搭建成本更高

我建议你用的落地方案(最快开始)

推荐:Playwright + AI 代码生成/修复

  1. 你先用 Playwright 把“关键路径”跑通(这部分最稳定)。
  2. 然后把以下信息喂给 AI:
    • 需求描述(要测什么)
    • 失败的日志/堆栈
    • 截图/HTML 片段(最好)
  3. AI 负责:生成/修改用例与断言(而不是盲目全自动操作)。

为了我给你“具体可用”的方案,我问你3个问题

  1. 你希望用 Playwright 还是 Selenium?(或都可以)
  2. 你的项目是 纯前端页面 还是有后端接口(登录、API 校验)?
  3. 你更想要哪种智能体:
    • A. AI 帮你写/改测试代码(最稳定)
    • B. AI 直接按自然语言操作网页(更智能但要工程适配)

你回答这3点后,我可以给你一套可运行的架构(包含目录结构、示例代码、以及“把失败信息喂给智能体”的具体格式)。