跳转到主要内容
browser-use 是一个基于 Python 的浏览器代理,提供可编程的浏览器自动化能力。支持本地 Chrome、Lexmount 云浏览器和 AgentBay 云浏览器。

安装

# 安装核心依赖并注册 bubench CLI
uv sync
bubench run 会在首次运行时创建 config.yaml 中指定的 venv(默认 .venvs/browser_use),并自动安装 browser-use extra 依赖。 使用 bubench 前请先激活 .venv(或使用 uv run bubench ...)。

配置

先复制示例配置,再编辑:
cp configs/agents/browser-use/config.yaml.example configs/agents/browser-use/config.yaml
编辑 configs/agents/browser-use/config.yaml
# browser-use Agent Configuration
# Copy this file to config.yaml and fill in your credentials.

# Model Type: OPENAI, GEMINI, BROWSER_USE
MODEL_TYPE: BROWSER_USE

# Model ID
MODEL_ID: BU-1.0

# Browser Use API Key
BROWSER_USE_API_KEY: your_api_key_here

# OpenAI Config (Optional)
# MODEL_TYPE: OPENAI
# MODEL_ID: gpt-4.1
# OPENAI_API_KEY: your_api_key_here
# OPENAI_BASE_URL: https://api.example.com/v1

# Gemini Config (Optional)
# MODEL_TYPE: GEMINI
# MODEL_ID: gemini-3-flash-preview
# GEMINI_API_KEY: your_api_key_here
# GEMINI_BASE_URL: https://api.example.com/v1
# GEMINI3_THINKING_LEVEL: high # Options: low, medium, high (Only for Gemini 3 series models)

# Browser Configuration
# Options: Chrome-Local, lexmount, browser-use-cloud, agentbay
BROWSER_ID: Chrome-Local

# Lexmount Browser Mode Config
LEXMOUNT_BROWSER_MODE: normal

# AgentBay 云浏览器配置(仅 BROWSER_ID=agentbay 时使用)
# 请在 .env 中设置 AGENTBAY_API_KEY(不要写入 config.yaml)
# AGENTBAY_IMAGE_ID: browser_latest
# AGENTBAY_ENABLE_BROWSER_REPLAY: true
# AGENTBAY_BROWSER_USE_STEALTH: false

# Agent Parameters
USE_VISION: false  # Enable/disable vision capabilities (default: false)
MAX_STEPS: 40      # Maximum number of steps per task (default: 40)

# Task Timeout (seconds)
TIMEOUT: 600

支持的模型类型

MODEL_TYPE说明配置项
OPENAIOpenAI 模型OPENAI_API_KEY, OPENAI_BASE_URL
GEMINIGemini 模型GEMINI_API_KEY, GEMINI_BASE_URL
BROWSER_USEBrowser Use 官方 APIBROWSER_USE_API_KEY

配置说明

参数说明可选值/示例
MODEL_TYPE模型提供商类型OPENAI, GEMINI, BROWSER_USE
MODEL_ID模型 IDBU-1.0, gpt-4o, gemini-3-flash-preview
BROWSER_USE_API_KEYBrowser Use 官方 API Key仅主要用于 BROWSER_USE 模式
BROWSER_ID浏览器类型Chrome-Local, lexmount, browser-use-cloud, agentbay
USE_VISION启用视觉能力true, false (默认)
MAX_STEPS最大任务步数整数 (默认 40)
TIMEOUT任务超时时间(秒)默认 600,CLI --timeout 优先
GEMINI3_THINKING_LEVELGemini 3 思考等级low, medium, high
LEXMOUNT_BROWSER_MODELexmount 浏览器模式normal (缺省), uc
AGENTBAY_API_KEYAgentBay API Key仅从 .envAGENTBAY_API_KEY 读取
AGENTBAY_IMAGE_IDAgentBay 会话镜像 ID默认 browser_latest
AGENTBAY_ENABLE_BROWSER_REPLAY是否开启 AgentBay 浏览器录制true (默认), false
AGENTBAY_BROWSER_USE_STEALTH是否开启 AgentBay stealth 选项false (默认), true

AgentBay 运行说明

  • AgentBay SDK 按可选依赖处理。包缺失或导出不兼容时,仅在 BROWSER_ID=agentbay 才会报错,其他浏览器模式不受影响。
  • AgentBay 后端会话清理失败只会记录日志,不会覆盖任务执行阶段的原始错误。

浏览器模式

本地浏览器

使用本地 Chrome 浏览器,适合开发调试。
BROWSER_ID: "Chrome-Local"

云浏览器

使用 Lexmount 云浏览器,适合大规模评测。
BROWSER_ID: "lexmount"
关于云浏览器的详细配置,请参考 Lexmount 云浏览器

使用示例

基础运行

# 运行 LexBench-Browser 前 3 个任务
bubench run \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode first_n \
  --count 3

# 运行全部任务(跳过已完成)
bubench run \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode all \
  --skip-completed

指定任务运行

# 运行指定 ID 的任务
bubench run \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode specific \
  --task-ids task_id_1 task_id_2

评估

# 评估结果
bubench eval --agent browser-use --benchmark LexBench-Browser

# 使用 stepwise 策略(逐步评估)
bubench eval --agent browser-use --benchmark LexBench-Browser --eval_strategy stepwise

# 使用 final 策略(仅最终结果)
bubench eval --agent browser-use --benchmark LexBench-Browser --eval_strategy final

支持的 Benchmarks

  • ✅ LexBench-Browser
  • ✅ Online-Mind2Web
  • ✅ BrowseComp

相关链接