跳转到主要内容

API 参考

本节提供 browseruse_bench 包的完整模块参考。

包结构

browseruse_bench/

└── utils/                # 工具模块
│   ├── task_utils.py     # 任务处理
│   ├── eval_utils.py     # 评估工具
│   ├── cli_utils.py      # 命令行参数解析
│   ├── stats_utils.py    # 统计工具
│   └── config_loader.py  # 配置加载

快速导入

# 导入工具函数
from browseruse_bench.utils import (
    REPO_ROOT,
    load_tasks,
    filter_tasks,
    EvaluationModel,
    load_evaluation_model,
    create_run_parser,
    create_eval_parser,
    generate_evaluation_summary,
    load_config_file,
)

模块导航

Task Utils

任务加载、过滤与处理

Eval Utils

评估模型与打分工具

CLI Utils

命令行参数解析

Stats Utils

统计计算与汇总生成

Config Loader

YAML 配置加载