browser-use

browser-use 是一个基于 Python 的浏览器代理，提供可编程的浏览器自动化能力。支持本地 Chrome 和 Lexmount 云浏览器。

安装

# 安装 browseruse-bench 并启用 browser-use 支持
pip install browseruse-bench[browser-use]

# 或使用 uv
uv sync --extra browser-use

配置

先复制示例配置，再编辑：

cp agents/browser-use/config.yaml.example agents/browser-use/config.yaml

编辑 agents/browser-use/config.yaml：

# browser-use Agent 配置文件

# 模型类型：OPENAI, GEMINI, BROWSER_USE
MODEL_TYPE: GEMINI

# 模型 ID
MODEL_ID: gemini-3-flash-preview

# Gemini 配置
GEMINI_API_KEY: your_api_key_here
GEMINI_BASE_URL: https://api.example.com

# 浏览器配置
# 可选值：Chrome-Local, lexmount, browser-use-cloud
BROWSER_ID: lexmount

# Lexmount 浏览器模式配置
# normal: 普通模式（默认，支持登录态复用）
# uc: 无痕模式（用于首次登录和账号管理）
LEXMOUNT_BROWSER_MODE: normal

# 任务超时时间（秒），可通过 --timeout 命令行参数覆盖
TIMEOUT: 300

支持的模型类型

MODEL_TYPE	说明	配置项
`OPENAI`	OpenAI 模型	`OPENAI_API_KEY`, `OPENAI_BASE_URL`
`GEMINI`	Gemini 模型	`GEMINI_API_KEY`, `GEMINI_BASE_URL`
`BROWSER_USE`	Browser Use 官方 API	`BROWSER_USE_API_KEY`

配置说明

参数	说明	可选值
`MODEL_TYPE`	模型提供商类型	`OPENAI`, `GEMINI`, `BROWSER_USE`
`MODEL_ID`	模型 ID	`gemini-3-flash-preview`, `gpt-4o`, `BU-1.0` 等
`BROWSER_ID`	浏览器类型	`Chrome-Local`（本地）, `lexmount`（云）, `browser-use-cloud`
`LEXMOUNT_BROWSER_MODE`	云浏览器模式	`normal`（保留登录态）, `uc`（无痕模式）
`TIMEOUT`	任务超时时间（秒）	默认 `300`，可通过 `--timeout` 覆盖

浏览器模式

本地浏览器

使用本地 Chrome 浏览器，适合开发调试。

BROWSER_ID: "local"

云浏览器

使用 Lexmount 云浏览器，适合大规模评测。

BROWSER_ID: "lexmount"

关于云浏览器的详细配置，请参考 Lexmount 云浏览器。

使用示例

基础运行

# 运行 LexBench-Browser 前 3 个任务
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode first_n \
  --count 3

# 运行全部任务（跳过已完成）
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode all \
  --skip-completed

调试模式

# 启用调试，查看详细日志
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode first_n \
  --count 1 \
  --debug

指定任务运行

# 运行指定 ID 的任务
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode specific \
  --task-ids "task_id_1,task_id_2"

评估

# 评估结果
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser

# 使用 stepwise 策略（逐步评估）
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser --eval_strategy stepwise

# 使用 final 策略（仅最终结果）
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser --eval_strategy final

支持的 Benchmarks

✅ LexBench-Browser
✅ Online-Mind2Web
✅ BrowseComp

开始

功能

示例

开发

安装

配置

支持的模型类型

配置说明

浏览器模式

本地浏览器

云浏览器

使用示例

基础运行

调试模式

指定任务运行

评估

支持的 Benchmarks

相关链接

开始

功能

示例

开发

​安装

​配置

​支持的模型类型

​配置说明

​浏览器模式

本地浏览器

云浏览器

​使用示例

​基础运行

​调试模式

​指定任务运行

​评估

​支持的 Benchmarks

​相关链接

安装

配置

支持的模型类型

配置说明

浏览器模式

使用示例

基础运行

调试模式

指定任务运行

评估

支持的 Benchmarks

相关链接