# browseruse-bench ## Docs - [Agent-TARS](https://docs.bubench.lexmount.io/zh/agents/agent-tars.md): 由 TARS 团队开发的浏览器代理 - [browser-use](https://docs.bubench.lexmount.io/zh/agents/browser-use.md): 基于 Python 的可编程浏览器代理 - [Claude Code](https://docs.bubench.lexmount.io/zh/agents/claude-code.md): 基于 Claude Code CLI 与 Playwright MCP 的浏览器自动化 Agent - [自定义 Agent](https://docs.bubench.lexmount.io/zh/agents/custom-agent.md): 如何将新 Agent 集成到 browseruse-bench 框架中 - [Agents 概览](https://docs.bubench.lexmount.io/zh/agents/overview.md): browseruse-bench 目前支持的浏览器代理列表 - [Skyvern](https://docs.bubench.lexmount.io/zh/agents/skyvern.md): 基于 Skyvern SDK 的浏览器自动化代理 - [API 参考](https://docs.bubench.lexmount.io/zh/api-reference/introduction.md): browseruse_bench 模块参考文档 - [cli_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/cli_utils.md): 命令行参数解析工具 - [config_loader](https://docs.bubench.lexmount.io/zh/api-reference/utils/config_loader.md): YAML 配置加载工具 - [eval_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/eval_utils.md): 评估模型与打分工具 - [stats_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/stats_utils.md): 统计计算与汇总生成工具 - [task_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/task_utils.md): 任务加载、过滤与处理工具 - [BrowseComp](https://docs.bubench.lexmount.io/zh/benchmarks/browsecomp.md): 浏览器操作竞赛任务评测 - [自定义 Benchmark](https://docs.bubench.lexmount.io/zh/benchmarks/custom-benchmark.md): 如何添加自己的 Benchmark 到 browseruse-bench - [数据加载](https://docs.bubench.lexmount.io/zh/benchmarks/data-loading.md): 了解如何加载和管理 Benchmark 数据集 - [LexBench-Browser](https://docs.bubench.lexmount.io/zh/benchmarks/lexbench-browser.md): 专为中文网站设计的浏览器评测基准 - [Online-Mind2Web](https://docs.bubench.lexmount.io/zh/benchmarks/online-mind2web.md): 真实网站 Web 交互任务评测 - [Benchmarks 概览](https://docs.bubench.lexmount.io/zh/benchmarks/overview.md): browseruse-bench 支持的浏览器评测基准 - [Lexmount 云浏览器](https://docs.bubench.lexmount.io/zh/browser/lexmount.md): 使用 Lexmount 云浏览器进行大规模自动化评测 - [本地 Chromium 浏览器](https://docs.bubench.lexmount.io/zh/browser/local.md): 在本机启动一个 Chromium 跑 agent,可选配 HTTP/SOCKS 代理 - [贡献指南](https://docs.bubench.lexmount.io/zh/development/contributing.md): 如何为 browseruse-bench 项目做出贡献 - [获取帮助](https://docs.bubench.lexmount.io/zh/development/get-help.md): 遇到问题?这里是获取帮助的渠道 - [完整工作流](https://docs.bubench.lexmount.io/zh/examples/complete-workflow.md): 从配置到评估的端到端流程 - [独立评估](https://docs.bubench.lexmount.io/zh/examples/evaluation-only.md): 使用标准化评估流程评估自定义 Agent 结果 - [介绍](https://docs.bubench.lexmount.io/zh/introduction.md): AI 浏览器代理的标准化一站式评测框架 - [成本统计](https://docs.bubench.lexmount.io/zh/leaderboard/cost-accounting.md): browseruse-bench 中 Token 与 Cost 指标的计算方式 - [排行榜](https://docs.bubench.lexmount.io/zh/leaderboard/overview.md): 查看和生成 Agent 性能排行榜 - [可视化工具](https://docs.bubench.lexmount.io/zh/leaderboard/visualization.md): 交互式实验浏览器,支持轨迹回放、评测详情查看和逐步 API 日志检索 - [快速开始](https://docs.bubench.lexmount.io/zh/quickstart.md): 5 分钟内完成 browseruse-bench 的安装和首次运行 ## OpenAPI Specs - [openapi](https://docs.bubench.lexmount.io/api-reference/openapi.json)