之前介绍过 Codex 官方出品的插件 Chrome 也可以自动化操作浏览器,但是用了没几天不知道什么情况我的 Windows 电脑上搜不到这个插件了,没法使用了,于是就试着找别的软件。

后面看到一个项目,名字很直白——OpenCLI,做的事情用一句话就能说清:把任意网站变成命令行工具,同时让 AI Agent 用你已登录的浏览器去操作网页。

说实话,我当时第一反应是“又一个 Browser Use 封装吧”,但仔细看了之后发现,它做的事比我想的要大得多。


它到底在干嘛

OpenCLI 的核心思路其实很简单:你在浏览器里能做的事,它都想让你在终端里完成。

比如刷 B 站热门:

opencli bilibili hot --limit 5

比如看小红书搜索结果:

opencli xiaohongshu search "露营装备" --limit 10

比如下载 Twitter 上某人的视频:

opencli twitter download elonmusk --limit 20

它内置了 100 多个站点的适配器——B站、知乎、小红书、Twitter、Reddit、LinkedIn、Amazon、抖音、微博、微信读书、Spotify……基本上你能想到的主流平台都覆盖了。每个站点都有若干子命令,不是简单抓个首页,是真的能做到搜索、下载、评论、点赞、关注这些操作。

输出格式也灵活,--format json 直接吐 JSON,--format csv 导表格,--format md 出 Markdown,拿来给其他脚本或 Agent 当数据源非常方便。


关键:用的是你的登录态

这个才是重点。

大多数网页爬虫工具都有一个问题:它要么用自己的 headless 浏览器,要么需要你手动填 cookie。前者经常被反爬拦住,后者过期就得重新搞。

OpenCLI 的做法不一样。它通过一个 Chrome 扩展(叫 Browser Bridge)和你本地的 Chrome 建立连接。你在浏览器里登录了什么账号,OpenCLI 就能用什么身份去操作。

换句话说,你登录了小红书,opencli xiaohongshu 系列命令就能直接用,不需要额外配置 token 或 cookie。登录态过期了?打开浏览器重新登录一下就行。

这个设计看起来不起眼,但它解决了网页自动化最大的痛点——身份认证的维护成本


不只是爬数据,还能让 AI 帮你操作

OpenCLI 还有一层是给 AI Agent 用的。

它提供了一组 skill,可以装到 Claude Code、Cursor 这类 AI 编程工具里。装完之后,你的 AI Agent 就能直接用你已登录的浏览器去操作网页——导航、点击、填表单、提取数据,全在后台完成。

比如你跟 Agent 说“帮我看看小红书通知”,它就会通过 opencli browser 系列命令去操作你的 Chrome,把结果带回来。不需要你盯着屏幕,不需要手动复制粘贴。

而且它不是靠截图来“看”网页,而是读取 DOM 结构化快照,准确度高得多。

这个思路挺有意思:不是让 AI 自己开一个浏览器从零开始,而是复用你已经建立好的一切——你的账号、你的登录态、你的浏览习惯。


CLI Hub:把所有工具收归一处

除了网站适配器,OpenCLI 还做了一件很实用的事:它可以把你本地的命令行工具统一注册到 opencli 下面。

ghdockerobsidiantg-cliwx-clidiscord-cli……这些你平时各自为政的工具,注册之后都可以通过 opencli <tool> <command> 来调用。对了,连 Cursor、Trae CN、Codex 这些 Electron 桌面应用也能通过 CDP 协议控制。

一个入口,管所有工具。不用记那么多命令名,opencli list 一拉就全看到了。


安装和上手

两种方式:

桌面应用(推荐):https://opencli.info/download 下载 OpenCLIApp,macOS 和 Windows 都有。装好打开一次,它会帮你安装 opencli 命令行,还有系统托盘 UI 做诊断和更新。

1782180746947

npm 全局安装: 需要 Node.js 20 以上。

npm install -g @jackwener/opencli

我建议使用 APP 方式进行安装,真正的傻瓜化,从安装 opencli 命令到安装扩展以及 skills,都是通过界面去操作的。

安装 Chrome 扩展——通过 app 按钮提示安装 OpenCLI 扩展,首次安装完需要进入扩展管理中启用扩展。

ba3471d1-7783-495a-8d6b-2b1ccd254182

然后耐心等待 APP 识别成功即可,连接成功后浏览器扩展也会显示 connected

1782183190332_d


使用过程

通过 APP 的操作指示安装 Agent Skills 后,就可以在你的 Claude Code 或者Codex中看到该技能了:

7438a4ae-1285-4781-88b2-a05b917e53ab

然后我们通过会话启用:

93fa303e-b099-48ea-9676-df3566051092

然后顺利的打开浏览器搜索,虽然是新开启了一个浏览器,但是依然保持你当前已经登录的 cookie,我们继续下一步:

92a8e9db-0018-4c41-b77d-58a602889d3a

后续操作执行都很顺利,并且能够延续上一次执行的会话,体验感拉满。


谁该用,谁可以先观望

如果你经常需要从网站批量拿数据——不管是做竞品分析、内容监控、还是给自己攒信息源,OpenCLI 比手写爬虫省太多事了,而且不用操心反爬和登录态维护。

如果你在用 AI Agent 做自动化——Claude Code、Cursor、Hermes 之类的,OpenCLI 的 skill 装上之后,Agent 就多了一双“手”,能真的去操作网页,而不只是生成代码让你自己去跑。

如果你终端用得多,浏览器开得少——这个工具简直就是为你设计的。很多事不用再打开浏览器了。

如果你主要用手机,电脑开得少——那这个工具暂时帮不上太多忙,它的主场在桌面终端。


三个月做到 25000 星,这个速度在开源项目里算很快了。我觉得它戳中的需求很真实:我们每天在浏览器里花大量时间做重复操作,而终端和 AI Agent 早就准备好了接管这些事,只是缺一座桥。

OpenCLI 就是那座桥。

项目地址:https://github.com/jackwener/opencli 官网:https://opencli.info