默认本地
默认使用本地数据。HuggingFace 模式会下载到 HF 缓存(~/.cache/huggingface)。
JSONL 格式
采用高效的 JSONL 格式存储数据,支持流式读取。
数据源配置
1. 普通 Benchmark
对于 LexBench-Browser 和 Online-Mind2Web,在benchmarks/{benchmark}/data/data_info.json 中配置 HuggingFace 信息:
benchmarks/{benchmark}/data/,支持子目录
(例如 LexBench-Browser/、LexBench-Online_Mind2Web/ 或日期文件夹)。
2. BrowseComp(本地或 HuggingFace)
BrowseComp 支持本地 JSONL 文件或 HuggingFace 下载。使用 HuggingFace 时,parquet 会下载到 HF 缓存并转换为 JSONL 供使用。hf_repo_id:数据集仓库 ID。hf_path_prefix:仓库内子目录(例如data)。hf_filename:parquet 文件名。hf_revision(可选):仓库版本。hf_private(可选):私有仓库设为true。
命令行使用
bubench run 与 bubench eval 支持 --data-source 参数来控制数据加载行为:
| 模式 | 描述 |
|---|---|
local (默认) | 使用本地数据。文件不存在则报错,适用于离线环境。 |
huggingface | 从 HuggingFace 下载并使用 HF 缓存(默认 ~/.cache/huggingface)。 |
--force-download | 配合 huggingface 使用,强制重新下载到 HF 缓存。 |
- 本地目录与 HF 缓存相互独立,HF 下载不会写回
benchmarks/...。 --force-download仅对huggingface模式生效。- BrowseComp 的 HuggingFace 数据为 parquet,会在 HF 缓存中转换为 JSONL。
运行示例
评估示例(LexBench-Browser)
bubench eval 仅对 LexBench-Browser 透传 --data-source,其他基准从结果文件或本地路径读取。
环境变量配置
如果使用私有数据集,必须配置HF_TOKEN 环境变量。
~/.cache/huggingface,可通过 HF_HOME 或 HF_HUB_CACHE 覆盖。
数据格式说明
JSONL 格式
为了提高大文件处理效率,我们统一使用 JSONL (JSON Lines) 格式,即每行是一个独立的 JSON 对象。tasks.jsonl
目录结构
常见问题排查
私有数据集提示认证错误
私有数据集提示认证错误
错误:
Private HuggingFace dataset requires authentication解决: 确保已设置 HF_TOKEN 环境变量。下载速度太慢
下载速度太慢
方案 1: 如果在中国大陆,可以使用 HF 镜像:方案 2: 手动下载文件放置到对应的
benchmarks/{name}/data/{split_path} 目录下。