browseruse_bench.utils.cli_utils
命令行参数解析与错误处理工具。导入
handle_cli_errors
CLI 错误处理装饰器,统一处理异常和退出码。使用示例
行为
| 条件 | 退出码 |
|---|---|
| 正常返回 | 函数返回值 |
| KeyboardInterrupt | 130 |
| 其他异常 | 1 |
create_run_parser
为主运行脚本创建参数解析器。包含的参数
| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
--mode | choice | all | 运行模式:single、first_n、specific、sample_n、by_id、all |
--count | int | 1 | first_n 或 sample_n 模式下的任务数量 |
--task-ids | list | - | specific 模式下的任务 ID 列表 |
--id | str | - | by_id 模式下的单个任务 ID |
--timeout | int | - | 每个任务的超时时间(秒) |
--skip-completed | flag | False | 跳过已完成的任务 |
--dry-run | flag | False | 只显示命令,不实际执行 |
create_eval_parser
为评估脚本创建参数解析器。包含的参数
| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
--mode | str | - | 评估模式 |
--model | str | - | 评估模型 |
--score-threshold | int | - | 分数阈值(LexBench-Browser=60,其他=3) |
--num-worker | int | 1 | 并行进程数 |
--api-key | str | - | API Key |
--base-url | str | - | API Base URL |
--dry-run | flag | False | 只显示命令,不实际执行 |
create_base_agent_parser
为 Agentrun.py 创建基础参数解析器。
解析器描述
默认的 tasks JSON 文件路径
默认输出目录