# Run tasks bubench run --agent browser-use --benchmark BrowseComp --mode first_n --count 3 # Evaluate results bubench eval --agent browser-use --benchmark BrowseComp
bubench run --agent browser-use --benchmark BrowseComp \ --data-source huggingface