安装
bubench run 会在首次运行时创建 config.yaml 中指定的 venv(默认 .venvs/browser_use),并自动安装 browser-use extra 依赖。
使用 bubench 前请先激活 .venv(或使用 uv run bubench ...)。
配置
先复制示例配置,再编辑:configs/agents/browser-use/config.yaml:
支持的模型类型
| MODEL_TYPE | 说明 | 配置项 |
|---|---|---|
OPENAI | OpenAI 模型 | OPENAI_API_KEY, OPENAI_BASE_URL |
GEMINI | Gemini 模型 | GEMINI_API_KEY, GEMINI_BASE_URL |
BROWSER_USE | Browser Use 官方 API | BROWSER_USE_API_KEY |
配置说明
| 参数 | 说明 | 可选值/示例 |
|---|---|---|
MODEL_TYPE | 模型提供商类型 | OPENAI, GEMINI, BROWSER_USE |
MODEL_ID | 模型 ID | BU-1.0, gpt-4o, gemini-3-flash-preview |
BROWSER_USE_API_KEY | Browser Use 官方 API Key | 仅主要用于 BROWSER_USE 模式 |
BROWSER_ID | 浏览器类型 | Chrome-Local, lexmount, browser-use-cloud, agentbay |
USE_VISION | 启用视觉能力 | true, false (默认) |
MAX_STEPS | 最大任务步数 | 整数 (默认 40) |
TIMEOUT | 任务超时时间(秒) | 默认 600,CLI --timeout 优先 |
GEMINI3_THINKING_LEVEL | Gemini 3 思考等级 | low, medium, high |
LEXMOUNT_BROWSER_MODE | Lexmount 浏览器模式 | normal (缺省), uc |
AGENTBAY_API_KEY | AgentBay API Key | 仅从 .env 中 AGENTBAY_API_KEY 读取 |
AGENTBAY_IMAGE_ID | AgentBay 会话镜像 ID | 默认 browser_latest |
AGENTBAY_ENABLE_BROWSER_REPLAY | 是否开启 AgentBay 浏览器录制 | true (默认), false |
AGENTBAY_BROWSER_USE_STEALTH | 是否开启 AgentBay stealth 选项 | false (默认), true |
AgentBay 运行说明
- AgentBay SDK 按可选依赖处理。包缺失或导出不兼容时,仅在
BROWSER_ID=agentbay才会报错,其他浏览器模式不受影响。 - AgentBay 后端会话清理失败只会记录日志,不会覆盖任务执行阶段的原始错误。
浏览器模式
本地浏览器
使用本地 Chrome 浏览器,适合开发调试。
云浏览器
使用 Lexmount 云浏览器,适合大规模评测。
使用示例
基础运行
指定任务运行
评估
支持的 Benchmarks
- ✅ LexBench-Browser
- ✅ Online-Mind2Web
- ✅ BrowseComp