# browseruse-bench

## Docs

- [Agent-TARS](https://docs.bubench.lexmount.io/zh/agents/agent-tars.md): 由 TARS 团队开发的浏览器代理
- [browser-use](https://docs.bubench.lexmount.io/zh/agents/browser-use.md): 基于 Python 的可编程浏览器代理
- [Claude Code](https://docs.bubench.lexmount.io/zh/agents/claude-code.md): 基于 Claude Code CLI 与 Playwright MCP 的浏览器自动化 Agent
- [自定义 Agent](https://docs.bubench.lexmount.io/zh/agents/custom-agent.md): 如何将新 Agent 集成到 browseruse-bench 框架中
- [Agents 概览](https://docs.bubench.lexmount.io/zh/agents/overview.md): browseruse-bench 目前支持的浏览器代理列表
- [Skyvern](https://docs.bubench.lexmount.io/zh/agents/skyvern.md): 基于 Skyvern SDK 的浏览器自动化代理
- [API 参考](https://docs.bubench.lexmount.io/zh/api-reference/introduction.md): browseruse_bench 模块参考文档
- [cli_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/cli_utils.md): 命令行参数解析工具
- [config_loader](https://docs.bubench.lexmount.io/zh/api-reference/utils/config_loader.md): YAML 配置加载工具
- [eval_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/eval_utils.md): 评估模型与打分工具
- [stats_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/stats_utils.md): 统计计算与汇总生成工具
- [task_utils](https://docs.bubench.lexmount.io/zh/api-reference/utils/task_utils.md): 任务加载、过滤与处理工具
- [BrowseComp](https://docs.bubench.lexmount.io/zh/benchmarks/browsecomp.md): 浏览器操作竞赛任务评测
- [自定义 Benchmark](https://docs.bubench.lexmount.io/zh/benchmarks/custom-benchmark.md): 如何添加自己的 Benchmark 到 browseruse-bench
- [数据加载](https://docs.bubench.lexmount.io/zh/benchmarks/data-loading.md): 了解如何加载和管理 Benchmark 数据集
- [LexBench-Browser](https://docs.bubench.lexmount.io/zh/benchmarks/lexbench-browser.md): 专为中文网站设计的浏览器评测基准
- [Online-Mind2Web](https://docs.bubench.lexmount.io/zh/benchmarks/online-mind2web.md): 真实网站 Web 交互任务评测
- [Benchmarks 概览](https://docs.bubench.lexmount.io/zh/benchmarks/overview.md): browseruse-bench 支持的浏览器评测基准
- [Lexmount 云浏览器](https://docs.bubench.lexmount.io/zh/browser/lexmount.md): 使用 Lexmount 云浏览器进行大规模自动化评测
- [本地 Chromium 浏览器](https://docs.bubench.lexmount.io/zh/browser/local.md): 在本机启动一个 Chromium 跑 agent，可选配 HTTP/SOCKS 代理
- [贡献指南](https://docs.bubench.lexmount.io/zh/development/contributing.md): 如何为 browseruse-bench 项目做出贡献
- [获取帮助](https://docs.bubench.lexmount.io/zh/development/get-help.md): 遇到问题？这里是获取帮助的渠道
- [完整工作流](https://docs.bubench.lexmount.io/zh/examples/complete-workflow.md): 从配置到评估的端到端流程
- [独立评估](https://docs.bubench.lexmount.io/zh/examples/evaluation-only.md): 使用标准化评估流程评估自定义 Agent 结果
- [介绍](https://docs.bubench.lexmount.io/zh/introduction.md): AI 浏览器代理的标准化一站式评测框架
- [成本统计](https://docs.bubench.lexmount.io/zh/leaderboard/cost-accounting.md): browseruse-bench 中 Token 与 Cost 指标的计算方式
- [排行榜](https://docs.bubench.lexmount.io/zh/leaderboard/overview.md): 查看和生成 Agent 性能排行榜
- [可视化工具](https://docs.bubench.lexmount.io/zh/leaderboard/visualization.md): 交互式实验浏览器，支持轨迹回放、评测详情查看和逐步 API 日志检索
- [快速开始](https://docs.bubench.lexmount.io/zh/quickstart.md): 5 分钟内完成 browseruse-bench 的安装和首次运行

## OpenAPI Specs

- [openapi](https://docs.bubench.lexmount.io/api-reference/openapi.json)