跳转到主要内容

browseruse_bench.utils.cli_utils

命令行参数解析与错误处理工具。

导入

from browseruse_bench.utils import (
    handle_cli_errors,
    create_run_parser,
    create_eval_parser,
    create_base_agent_parser,
)

handle_cli_errors

CLI 错误处理装饰器,统一处理异常和退出码。
def handle_cli_errors(func: Callable[..., int]) -> Callable[..., None]

使用示例

from browseruse_bench.utils import handle_cli_errors

@handle_cli_errors
def main() -> int:
    # 你的逻辑
    return 0  # 成功

if __name__ == "__main__":
    main()

行为

条件退出码
正常返回函数返回值
KeyboardInterrupt130
其他异常1

create_run_parser

为主运行脚本创建参数解析器。
def create_run_parser() -> argparse.ArgumentParser

包含的参数

参数类型默认值说明
--modechoiceall运行模式:singlefirst_nspecificsample_nby_idall
--countint1first_nsample_n 模式下的任务数量
--task-idslist-specific 模式下的任务 ID 列表
--idstr-by_id 模式下的单个任务 ID
--timeoutint-每个任务的超时时间(秒)
--skip-completedflagFalse跳过已完成的任务
--dry-runflagFalse只显示命令,不实际执行

create_eval_parser

为评估脚本创建参数解析器。
def create_eval_parser() -> argparse.ArgumentParser

包含的参数

参数类型默认值说明
--modestr-评估模式
--modelstr-评估模型
--score-thresholdint-分数阈值(LexBench-Browser=60,其他=3)
--num-workerint1并行进程数
--api-keystr-API Key
--base-urlstr-API Base URL
--dry-runflagFalse只显示命令,不实际执行

create_base_agent_parser

为 Agent run.py 创建基础参数解析器。
def create_base_agent_parser(
    description: str,
    default_tasks_json: str,
    default_output_dir: str
) -> argparse.ArgumentParser
description
str
必填
解析器描述
default_tasks_json
str
必填
默认的 tasks JSON 文件路径
default_output_dir
str
必填
默认输出目录

使用示例

from browseruse_bench.utils import create_base_agent_parser

parser = create_base_agent_parser(
    description="Browser-Use Agent Runner",
    default_tasks_json="data/tasks.json",
    default_output_dir="output/"
)
args = parser.parse_args()