browseruse-bench 是一个统一的评测框架,用于在多种基准测试上测试 AI 浏览器代理。它提供了标准化的接口来运行和评估不同的代理在各种 Web 交互任务上的表现。Documentation Index
Fetch the complete documentation index at: https://docs.bubench.lexmount.io/llms.txt
Use this file to discover all available pages before exploring further.
快速开始
5 分钟内完成环境配置
支持的 Agents
查看所有支持的浏览器代理
Benchmarks
探索可用的基准测试
排行榜
查看代理性能排名
核心特性
多 Agent 支持
统一接口支持 Agent-TARS、browser-use 等多种代理
多 Benchmark
LexBench-Browser、Online-Mind2Web、BrowseComp
云浏览器
集成 Lexmount 云浏览器,支持大规模测试
自动评估
基于 GPT-4 的自动评估,提供详细指标