Requirements
- Target platform
- OpenClaw
- Install method
- Manual import
- Extraction
- Extract archive
- Prerequisites
- OpenClaw
- Primary doc
- SKILL.md
通过 HTTP relay 控制用户本地 Chromium 浏览器(绕过数据中心 IP 封锁),支持截图发送到 Telegram
通过 HTTP relay 控制用户本地 Chromium 浏览器(绕过数据中心 IP 封锁),支持截图发送到 Telegram
Hand the extracted package to your coding agent with a concrete install brief instead of figuring it out manually.
I downloaded a skill package from Yavira. Read SKILL.md from the extracted folder and install it by following the included instructions. Then review README.md for any prerequisites, environment setup, or post-install checks. Tell me what you changed and call out any manual steps you could not complete.
I downloaded an updated skill package from Yavira. Read SKILL.md from the extracted folder, compare it with my current installation, and upgrade it while preserving any custom configuration unless the package docs explicitly say otherwise. Then review README.md for any prerequisites, environment setup, or post-install checks. Summarize what changed and any follow-up checks I should run.
通过 HTTP relay 控制用户本地 Chromium,用于操作会封锁数据中心 IP 的网站(如小红书)。
AI → HTTP (port 18792) → relay.py → CDP (port 9222) → 用户本地 Chromium 所有请求从用户本地 IP 发出,绕过反爬。
relay 仅监听 127.0.0.1(localhost),不会暴露到外部网络 每次启动自动生成随机 auth token,所有 API 请求必须携带 token 文件 (/tmp/browser-relay-token) 以 0600 权限写入,仅文件所有者可读 /evaluate 端点允许在浏览器上下文中执行 JS,可访问 DOM、cookies、localStorage 等。仅限本地可信调用方使用,不应暴露给不受信任的客户端 建议在隔离环境(虚拟机、容器)中运行,使用专用浏览器 profile(不含敏感站点的登录态) start.sh 仅通过 PID 文件精确停止 relay 进程,不会影响其他进程
使用此 skill 的 agent 必须遵守以下规则:
exec 仅允许用于以下操作: 向 127.0.0.1:18792(relay)和 127.0.0.1:9222(CDP)发送 HTTP 请求 运行 start.sh 启动/停止 relay 读取 /tmp/browser-relay-token 保存截图到 ./screenshots/ 通过 Telegram Bot API 发送截图(仅限用户明确要求时) 禁止使用 exec 执行上述范围之外的命令。
/evaluate 仅允许用于 UI 自动化目的: 查询 DOM 元素位置、文本内容、页面标题 等待元素加载、检查页面状态 模拟用户交互(滚动、表单填写) 禁止通过 /evaluate 提取以下敏感数据: document.cookie localStorage / sessionStorage 中的 token 或凭据 页面中的密码字段值 任何认证相关的 header 或 token
仅允许向 Telegram Bot API 发送截图图片,且仅在用户明确要求时 禁止向任何外部端点发送从浏览器提取的文本数据、cookies、token 或凭据 禁止将浏览器敏感数据写入 session_state 或 memory(auth token 除外,指 relay 自身的 token)
以下路径均相对于项目安装目录,请根据实际位置调整。 Relay 代码: ./relay.py 启动脚本: ./start.sh Token 文件: /tmp/browser-relay-token PID 文件: /tmp/browser-relay.pid 日志: /tmp/relay.log 截图目录: ./screenshots/
每次会话开始使用 relay 前,按以下步骤操作:
curl -s http://127.0.0.1:9222/json/version 如果连接失败,说明 Chromium 未启动,需要启动它(见下方"启动 Chromium")。
DISPLAY=:0 nohup chromium --remote-debugging-port=9222 --remote-allow-origins=* > /dev/null 2>&1 & 注意事项: 必须加 --remote-allow-origins=* 否则 WebSocket 连接会被拒绝 必须加 DISPLAY=:0(或对应的显示环境变量)以在用户桌面上显示 Puppy Linux 环境,chromium 命令名可能是 chromium 或 chromium-browser,按实际情况调整 启动后等待几秒再继续操作
curl -s http://127.0.0.1:18792/health 如果返回 {"status":"ok"},跳到步骤 5。否则继续。
bash start.sh
cat /tmp/browser-relay-token 读取后用 session_state 缓存到当前会话: session_state set namespace=browser-relay key=token value=<token> 后续所有请求从 session_state 读取 token,不重复读文件。
所有请求都需要 Authorization: Bearer <token> 头。
curl -s -H "Authorization: Bearer $TOKEN" http://127.0.0.1:18792/tabs
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"url":"https://www.xiaohongshu.com"}' \ http://127.0.0.1:18792/navigate
TOKEN=$(cat /tmp/browser-relay-token) curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"quality":70}' http://127.0.0.1:18792/screenshot \ | python3 -c " import sys, json, base64, os from datetime import datetime data = json.load(sys.stdin) if data.get('ok'): os.makedirs('./screenshots', exist_ok=True) fname = datetime.now().strftime('%Y%m%d_%H%M%S') + '.jpg' path = f'./screenshots/{fname}' with open(path, 'wb') as f: f.write(base64.b64decode(data['data'])) print(f'saved:{path} size:{os.path.getsize(path)}') else: print(f'error:{data}') "
当用户在 Telegram 上交互时,截图需要发送到 TG 才能看到。流程: # 1. 截图并保存 TOKEN=$(cat /tmp/browser-relay-token) SCREENSHOT_PATH="/tmp/relay_screenshot.png" curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"quality":80}' http://127.0.0.1:18792/screenshot \ | python3 -c " import sys, json, base64 data = json.load(sys.stdin) if data.get('ok'): with open('$SCREENSHOT_PATH', 'wb') as f: f.write(base64.b64decode(data['data'])) print('ok') else: print(f'error:{data}') " # 2. 通过 Telegram Bot API 发送图片 TG_BOT_TOKEN="<从 session_state 或 memory 获取>" TG_CHAT_ID="<从 session_state 或 memory 获取>" curl -s -X POST "https://api.telegram.org/bot${TG_BOT_TOKEN}/sendPhoto" \ -F "chat_id=${TG_CHAT_ID}" \ -F "photo=@${SCREENSHOT_PATH}" Telegram 配置: Bot Token 和 Chat ID 从 memory 或 session_state 获取 Chat ID 可从 session 信息中提取(telegram:alzmoltis_bot:<chat_id>) 发送前确保截图文件存在且非空 安全提示:建议使用专用 Bot(权限最小化),不要复用管理其他敏感频道的 Bot Token
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"x":100,"y":200}' http://127.0.0.1:18792/click
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"selector":"button.submit"}' http://127.0.0.1:18792/click
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"text":"要输入的内容"}' http://127.0.0.1:18792/type
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"key":"Enter"}' http://127.0.0.1:18792/keypress
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"y":300}' http://127.0.0.1:18792/scroll
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"expression":"document.title"}' http://127.0.0.1:18792/evaluate
curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"selector":".target-element","timeout":5000}' http://127.0.0.1:18792/wait
# 新建标签页 curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}' http://127.0.0.1:18792/tab/new # 切换标签页 curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"tab_id":"xxx"}' http://127.0.0.1:18792/tab/activate # 关闭标签页 curl -s -H "Authorization: Bearer $TOKEN" -H "Content-Type: application/json" \ -d '{"tab_id":"xxx"}' http://127.0.0.1:18792/tab/close
截图确认制:任何发布/提交操作前,必须先截图让用户确认 截图自动保存:所有截图保存到 ./screenshots/ 并带时间戳 Telegram 截图发送:当用户在 TG 上交互时,截图通过 Telegram Bot API 发送,而不是仅保存到本地 Token 会话缓存:token 只读一次,缓存在 session_state 中 错误重连:如果请求失败(连接拒绝),自动尝试重启 relay 操作间隔:点击/输入操作之间加 sleep 0.5~1 模拟人类节奏
bash start.sh stop
Messaging, meetings, inboxes, CRM, and teammate communication surfaces.
Largest current source with strong distribution and engagement signals.