【分享】AI 自动化测试方案
- 内容介绍
- 文章标签
- 相关推荐
用 Claude Code 跑自动化测试时遇到过这种情况吗?生成了一堆测试用例,跑完发现 Token 烧了不少,结果一半是废的——要么断言写错,要么压根定位不到元素。
所以我花了点时间把市面上的 AI 测试方案摸了一遍。就两条路,DOM 解析或者视觉识别,先选一个深耕就行。
DOM
原理没什么花活。DOM 就是浏览器把 HTML 页面变成一棵可以被 JavaScript 随意增删改查的树状对象结构。简单说,你写的 HTML 被浏览器变成了一堆"会动的积木",这些积木可以用 JavaScript 随便抓、改、删、加。
AI 通过选择器找到这些积木,Playwright 负责点点点。就这样。
推荐工具:agent-browser
这是 Vercel 出的一个专门用于 AI Agent 的浏览器自动化 CLI,支持无头模式,可以不打开浏览器进行测试。
# 安装 CLI
npm install -g agent-browser
# 安装驱动
agent-browser install
# 验证安装
agent-browser open baidu.com
# 返回以下内容表示成功
# ✓ 百度一下,你就知道
# https://www.baidu.com/
image1830×1806 329 KB
这条路的好处很直接——Token 消耗低,跑得快,CI/CD 接进去顺滑。
但有个前提:你的 DOM 结构得稳定。
纯视觉
这个思路更直观:将页面截图发送给视觉大模型识别,模型返回下一步操作指令,循环执行直到完成全部任务。
推荐工具:Midscene
这是字节开源的纯视觉测试方案,支持 Web、Android、iOS,兼容多种视觉模型:Gemini、Qwen-VL、Doubao-VL。自然语言写测试目标,AI 自己生成脚本。
用 Claude Code 跑自动化测试时遇到过这种情况吗?生成了一堆测试用例,跑完发现 Token 烧了不少,结果一半是废的——要么断言写错,要么压根定位不到元素。
所以我花了点时间把市面上的 AI 测试方案摸了一遍。就两条路,DOM 解析或者视觉识别,先选一个深耕就行。
DOM
原理没什么花活。DOM 就是浏览器把 HTML 页面变成一棵可以被 JavaScript 随意增删改查的树状对象结构。简单说,你写的 HTML 被浏览器变成了一堆"会动的积木",这些积木可以用 JavaScript 随便抓、改、删、加。
AI 通过选择器找到这些积木,Playwright 负责点点点。就这样。
推荐工具:agent-browser
这是 Vercel 出的一个专门用于 AI Agent 的浏览器自动化 CLI,支持无头模式,可以不打开浏览器进行测试。
# 安装 CLI
npm install -g agent-browser
# 安装驱动
agent-browser install
# 验证安装
agent-browser open baidu.com
# 返回以下内容表示成功
# ✓ 百度一下,你就知道
# https://www.baidu.com/
image1830×1806 329 KB
这条路的好处很直接——Token 消耗低,跑得快,CI/CD 接进去顺滑。
但有个前提:你的 DOM 结构得稳定。
纯视觉
这个思路更直观:将页面截图发送给视觉大模型识别,模型返回下一步操作指令,循环执行直到完成全部任务。
推荐工具:Midscene
这是字节开源的纯视觉测试方案,支持 Web、Android、iOS,兼容多种视觉模型:Gemini、Qwen-VL、Doubao-VL。自然语言写测试目标,AI 自己生成脚本。

