Browser Use 出 CLI 了

2026-04-13 12:091阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

官方博客:Browser Use CLI - Browser Use
browser use是目前开源社区star数量最高的LLM浏览器调用工具,官方介绍:

Python library for AI browser automation with 79k+ GitHub stars. Connect any LLM and run locally or self-hosted.

在此之前,browser use在大部分场景下都通过MCP的方式来使用,但MCP诟病已久,这次官方下场出了一个CLI,支持MCP的绝大部分功能。
核心特性速览:
快到飞起:采用后台守护进程(Daemon),指令延迟仅 50ms
多模式切换: 默认无头模式(省资源),--headed 看它自动操作,--profile 关联真实的 Chrome 账号(免登录,直接用插件和 Cookie)
云端无缝连接:支持 cloud connect,本地没环境?直接白嫖云端算力。
Python 联动:可以在命令行里直接运行 Python 代码片段控制页面。这一点结合类似skill的概念应该会有不错的联动

安装方式

macOS/Linux: curl -fsSL https://browser-use.com/cli/install.sh | bash

Windows (PowerShell): & "C:\Program Files\Git\bin\bash.exe" -c 'curl -fsSL https://browser-use.com/cli/install.sh | bash'

部分命令

  • browser-use open [URL]:打开页面
  • browser-use state:返回页面所有可点击元素的编号
  • browser-use input 5 "我的账号":按编号自动填表
  • browser-use screenshot output.png:一键保存网页长图
网友解答:
--【壹】--:

论agent方便程度不如vercel的agent-browser,论底层能力不如微软的playwright,不上不下的,想不到什么场景下会用到
image1173×996 256 KB


--【贰】--:

我会试试


--【叁】--:

目测可以的


--【肆】--:

相对agent-browser,b-u能维持用户登录态,在复杂任务上会更优秀,agent-browser的封装在简单任务上会更快更省;相对于playwright,b-u在AI支持上会更好。playwright是针对自动化测试场景开发,b-u在它的基础上包了一层来支持AI,b-u也有自己的插件:https://docs.browser-use.com/open-source/examples/templates/playwright-integration。

实际上就看谁封装的更好,就像workflow和纯agent都有人做,但lang-graph把两个东西放在一块做的中不溜秋,也做的很好很受欢迎


--【伍】--:

跟 agent-browser by vercel-labs/agent-browser 对比呢?这个 skill 里也封了很多命令行


--【陆】--: OpenClaw 2026.3.13 的 Chrome DevTools MCP 浏览器自动化 开发调优
我也想知道Chrome DevTools MCP和Playwright MCP怎么选

这些定位好像都差不多,到底哪个好用,有没有评测


--【柒】--:

Linux上可以用吗


--【捌】--:

自动化浏览器工具太多了


--【玖】--:

同类工具呢,agnet-bowser在简单任务上表现更好,可以看场景判断怎么使用


--【拾】--:

cloud connect意思是使用云端桌面版的浏览器么?


--【拾壹】--:

谢谢分享等会试试,前面正好在看Browser Use原理+实战


--【拾贰】--:

Browser Use有什么优势吗?

标签:人工智能
问题描述:

官方博客:Browser Use CLI - Browser Use
browser use是目前开源社区star数量最高的LLM浏览器调用工具,官方介绍:

Python library for AI browser automation with 79k+ GitHub stars. Connect any LLM and run locally or self-hosted.

在此之前,browser use在大部分场景下都通过MCP的方式来使用,但MCP诟病已久,这次官方下场出了一个CLI,支持MCP的绝大部分功能。
核心特性速览:
快到飞起:采用后台守护进程(Daemon),指令延迟仅 50ms
多模式切换: 默认无头模式(省资源),--headed 看它自动操作,--profile 关联真实的 Chrome 账号(免登录,直接用插件和 Cookie)
云端无缝连接:支持 cloud connect,本地没环境?直接白嫖云端算力。
Python 联动:可以在命令行里直接运行 Python 代码片段控制页面。这一点结合类似skill的概念应该会有不错的联动

安装方式

macOS/Linux: curl -fsSL https://browser-use.com/cli/install.sh | bash

Windows (PowerShell): & "C:\Program Files\Git\bin\bash.exe" -c 'curl -fsSL https://browser-use.com/cli/install.sh | bash'

部分命令

  • browser-use open [URL]:打开页面
  • browser-use state:返回页面所有可点击元素的编号
  • browser-use input 5 "我的账号":按编号自动填表
  • browser-use screenshot output.png:一键保存网页长图
网友解答:
--【壹】--:

论agent方便程度不如vercel的agent-browser,论底层能力不如微软的playwright,不上不下的,想不到什么场景下会用到
image1173×996 256 KB


--【贰】--:

我会试试


--【叁】--:

目测可以的


--【肆】--:

相对agent-browser,b-u能维持用户登录态,在复杂任务上会更优秀,agent-browser的封装在简单任务上会更快更省;相对于playwright,b-u在AI支持上会更好。playwright是针对自动化测试场景开发,b-u在它的基础上包了一层来支持AI,b-u也有自己的插件:https://docs.browser-use.com/open-source/examples/templates/playwright-integration。

实际上就看谁封装的更好,就像workflow和纯agent都有人做,但lang-graph把两个东西放在一块做的中不溜秋,也做的很好很受欢迎


--【伍】--:

跟 agent-browser by vercel-labs/agent-browser 对比呢?这个 skill 里也封了很多命令行


--【陆】--: OpenClaw 2026.3.13 的 Chrome DevTools MCP 浏览器自动化 开发调优
我也想知道Chrome DevTools MCP和Playwright MCP怎么选

这些定位好像都差不多,到底哪个好用,有没有评测


--【柒】--:

Linux上可以用吗


--【捌】--:

自动化浏览器工具太多了


--【玖】--:

同类工具呢,agnet-bowser在简单任务上表现更好,可以看场景判断怎么使用


--【拾】--:

cloud connect意思是使用云端桌面版的浏览器么?


--【拾壹】--:

谢谢分享等会试试,前面正好在看Browser Use原理+实战


--【拾贰】--:

Browser Use有什么优势吗?

标签:人工智能