跳转到主要内容
browser-use 是一个基于 Python 的浏览器代理,提供可编程的浏览器自动化能力。支持本地 Chrome 和 Lexmount 云浏览器。

安装

# 安装 browseruse-bench 并启用 browser-use 支持
pip install browseruse-bench[browser-use]

# 或使用 uv
uv sync --extra browser-use

配置

先复制示例配置,再编辑:
cp agents/browser-use/config.yaml.example agents/browser-use/config.yaml
编辑 agents/browser-use/config.yaml
# browser-use Agent 配置文件

# 模型类型:OPENAI, GEMINI, BROWSER_USE
MODEL_TYPE: GEMINI

# 模型 ID
MODEL_ID: gemini-3-flash-preview

# Gemini 配置
GEMINI_API_KEY: your_api_key_here
GEMINI_BASE_URL: https://api.example.com

# 浏览器配置
# 可选值:Chrome-Local, lexmount, browser-use-cloud
BROWSER_ID: lexmount

# Lexmount 浏览器模式配置
# normal: 普通模式(默认,支持登录态复用)
# uc: 无痕模式(用于首次登录和账号管理)
LEXMOUNT_BROWSER_MODE: normal

# 任务超时时间(秒),可通过 --timeout 命令行参数覆盖
TIMEOUT: 300

支持的模型类型

MODEL_TYPE说明配置项
OPENAIOpenAI 模型OPENAI_API_KEY, OPENAI_BASE_URL
GEMINIGemini 模型GEMINI_API_KEY, GEMINI_BASE_URL
BROWSER_USEBrowser Use 官方 APIBROWSER_USE_API_KEY

配置说明

参数说明可选值
MODEL_TYPE模型提供商类型OPENAI, GEMINI, BROWSER_USE
MODEL_ID模型 IDgemini-3-flash-preview, gpt-4o, BU-1.0
BROWSER_ID浏览器类型Chrome-Local(本地), lexmount(云), browser-use-cloud
LEXMOUNT_BROWSER_MODE云浏览器模式normal(保留登录态), uc(无痕模式)
TIMEOUT任务超时时间(秒)默认 300,可通过 --timeout 覆盖

浏览器模式

本地浏览器

使用本地 Chrome 浏览器,适合开发调试。
BROWSER_ID: "local"

云浏览器

使用 Lexmount 云浏览器,适合大规模评测。
BROWSER_ID: "lexmount"
关于云浏览器的详细配置,请参考 Lexmount 云浏览器

使用示例

基础运行

# 运行 LexBench-Browser 前 3 个任务
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode first_n \
  --count 3

# 运行全部任务(跳过已完成)
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode all \
  --skip-completed

调试模式

# 启用调试,查看详细日志
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode first_n \
  --count 1 \
  --debug

指定任务运行

# 运行指定 ID 的任务
uv run scripts/run.py \
  --agent browser-use \
  --benchmark LexBench-Browser \
  --mode specific \
  --task-ids "task_id_1,task_id_2"

评估

# 评估结果
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser

# 使用 stepwise 策略(逐步评估)
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser --eval_strategy stepwise

# 使用 final 策略(仅最终结果)
uv run scripts/eval.py --agent browser-use --benchmark LexBench-Browser --eval_strategy final

支持的 Benchmarks

  • ✅ LexBench-Browser
  • ✅ Online-Mind2Web
  • ✅ BrowseComp

相关链接