有的,而且可以按“智能程度”和“落地难度”分几档来选。下面给你几种可用于 web 自动化测试的“智能体/方案”,从易到难:
1)AI 辅助写脚本(最容易上手)
- 用法:让 AI 生成 Playwright/Selenium 的测试代码,你只需要提供页面元素/测试目标。
- 智能体形态:通常是“聊天 + 代码生成/修复”。
- 优点:稳定、可控、成本低、最适合尽快做出测试集。
常见工具栈:
- Playwright(推荐)+ OpenAI/Claude 等模型做“代码生成/修复”
- 流程:AI 根据你描述的场景 → 输出 Playwright 用例 → 你运行 → 失败后把报错/截图发回 AI 让它改代码。
2)AI 直接“驱动浏览器找元素”(较智能)
- 用法:把测试任务写成自然语言,例如“点击登录→输入账号密码→断言用户名出现”,智能体尝试推断页面操作。
- 优点:更接近你说的“智能体”
- 注意:这类通常基于视觉/DOM语义或 LLM agent,有时对页面复杂度敏感(需要一定工程封装和稳定化策略)。
3)LLM + E2E 测试框架的“自愈智能体”(工程化更强)
-
用法:失败后自动做:
- 定位失败原因(超时/元素不可见/断言失败)
- 重新定位 locator(用替代选择器)
- 重新执行或最小化回滚
- 优点:维护成本显著下降,适合持续集成(CI)
- 缺点:搭建成本更高
我建议你用的落地方案(最快开始)
推荐:Playwright + AI 代码生成/修复
- 你先用 Playwright 把“关键路径”跑通(这部分最稳定)。
- 然后把以下信息喂给 AI:
- 需求描述(要测什么)
- 失败的日志/堆栈
- 截图/HTML 片段(最好)
- AI 负责:生成/修改用例与断言(而不是盲目全自动操作)。
为了我给你“具体可用”的方案,我问你3个问题
- 你希望用 Playwright 还是 Selenium?(或都可以)
- 你的项目是 纯前端页面 还是有后端接口(登录、API 校验)?
- 你更想要哪种智能体:
- A. AI 帮你写/改测试代码(最稳定)
- B. AI 直接按自然语言操作网页(更智能但要工程适配)
你回答这3点后,我可以给你一套可运行的架构(包含目录结构、示例代码、以及“把失败信息喂给智能体”的具体格式)。