之前介绍过 Codex 官方出品的插件 Chrome 也可以自动化操作浏览器,但是用了没几天不知道什么情况我的 Windows 电脑上搜不到这个插件了,没法使用了,于是就试着找别的软件。
后面看到一个项目,名字很直白——OpenCLI,做的事情用一句话就能说清:把任意网站变成命令行工具,同时让 AI Agent 用你已登录的浏览器去操作网页。
说实话,我当时第一反应是“又一个 Browser Use 封装吧”,但仔细看了之后发现,它做的事比我想的要大得多。
它到底在干嘛
OpenCLI 的核心思路其实很简单:你在浏览器里能做的事,它都想让你在终端里完成。
比如刷 B 站热门:
opencli bilibili hot --limit 5
比如看小红书搜索结果:
opencli xiaohongshu search "露营装备" --limit 10
比如下载 Twitter 上某人的视频:
opencli twitter download elonmusk --limit 20
它内置了 100 多个站点的适配器——B站、知乎、小红书、Twitter、Reddit、LinkedIn、Amazon、抖音、微博、微信读书、Spotify……基本上你能想到的主流平台都覆盖了。每个站点都有若干子命令,不是简单抓个首页,是真的能做到搜索、下载、评论、点赞、关注这些操作。
输出格式也灵活,--format json 直接吐 JSON,--format csv 导表格,--format md 出 Markdown,拿来给其他脚本或 Agent 当数据源非常方便。
关键:用的是你的登录态
这个才是重点。
大多数网页爬虫工具都有一个问题:它要么用自己的 headless 浏览器,要么需要你手动填 cookie。前者经常被反爬拦住,后者过期就得重新搞。
OpenCLI 的做法不一样。它通过一个 Chrome 扩展(叫 Browser Bridge)和你本地的 Chrome 建立连接。你在浏览器里登录了什么账号,OpenCLI 就能用什么身份去操作。
换句话说,你登录了小红书,opencli xiaohongshu 系列命令就能直接用,不需要额外配置 token 或 cookie。登录态过期了?打开浏览器重新登录一下就行。
这个设计看起来不起眼,但它解决了网页自动化最大的痛点——身份认证的维护成本。
不只是爬数据,还能让 AI 帮你操作
OpenCLI 还有一层是给 AI Agent 用的。
它提供了一组 skill,可以装到 Claude Code、Cursor 这类 AI 编程工具里。装完之后,你的 AI Agent 就能直接用你已登录的浏览器去操作网页——导航、点击、填表单、提取数据,全在后台完成。
比如你跟 Agent 说“帮我看看小红书通知”,它就会通过 opencli browser 系列命令去操作你的 Chrome,把结果带回来。不需要你盯着屏幕,不需要手动复制粘贴。
而且它不是靠截图来“看”网页,而是读取 DOM 结构化快照,准确度高得多。
这个思路挺有意思:不是让 AI 自己开一个浏览器从零开始,而是复用你已经建立好的一切——你的账号、你的登录态、你的浏览习惯。
CLI Hub:把所有工具收归一处
除了网站适配器,OpenCLI 还做了一件很实用的事:它可以把你本地的命令行工具统一注册到 opencli 下面。
gh、docker、obsidian、tg-cli、wx-cli、discord-cli……这些你平时各自为政的工具,注册之后都可以通过 opencli <tool> <command> 来调用。对了,连 Cursor、Trae CN、Codex 这些 Electron 桌面应用也能通过 CDP 协议控制。
一个入口,管所有工具。不用记那么多命令名,opencli list 一拉就全看到了。
安装和上手
两种方式:
桌面应用(推荐): 去 https://opencli.info/download 下载 OpenCLIApp,macOS 和 Windows 都有。装好打开一次,它会帮你安装 opencli 命令行,还有系统托盘 UI 做诊断和更新。

npm 全局安装: 需要 Node.js 20 以上。
npm install -g @jackwener/opencli
我建议使用 APP 方式进行安装,真正的傻瓜化,从安装 opencli 命令到安装扩展以及 skills,都是通过界面去操作的。
安装 Chrome 扩展——通过 app 按钮提示安装 OpenCLI 扩展,首次安装完需要进入扩展管理中启用扩展。

然后耐心等待 APP 识别成功即可,连接成功后浏览器扩展也会显示 connected :

使用过程
通过 APP 的操作指示安装 Agent Skills 后,就可以在你的 Claude Code 或者Codex中看到该技能了:

然后我们通过会话启用:

然后顺利的打开浏览器搜索,虽然是新开启了一个浏览器,但是依然保持你当前已经登录的 cookie,我们继续下一步:

后续操作执行都很顺利,并且能够延续上一次执行的会话,体验感拉满。
谁该用,谁可以先观望
如果你经常需要从网站批量拿数据——不管是做竞品分析、内容监控、还是给自己攒信息源,OpenCLI 比手写爬虫省太多事了,而且不用操心反爬和登录态维护。
如果你在用 AI Agent 做自动化——Claude Code、Cursor、Hermes 之类的,OpenCLI 的 skill 装上之后,Agent 就多了一双“手”,能真的去操作网页,而不只是生成代码让你自己去跑。
如果你终端用得多,浏览器开得少——这个工具简直就是为你设计的。很多事不用再打开浏览器了。
如果你主要用手机,电脑开得少——那这个工具暂时帮不上太多忙,它的主场在桌面终端。
三个月做到 25000 星,这个速度在开源项目里算很快了。我觉得它戳中的需求很真实:我们每天在浏览器里花大量时间做重复操作,而终端和 AI Agent 早就准备好了接管这些事,只是缺一座桥。
OpenCLI 就是那座桥。
项目地址:https://github.com/jackwener/opencli 官网:https://opencli.info