agent-evaluation

分类: 工具与效率 | 上传者: mlflowmlflow | 下载: 0 | 版本: v1.0(最新)

当您需要评估、改进或优化现有 LLM 代理的输出质量时,请使用此选项 - 包括提高工具选择准确性、答案质量、降低成本或解决代理给出错误/不完整响应的问题。使用 MLflow 评估与数据集、评分器和跟踪系统地评估代理。重要信息 - 在开始任何工作之前,始终加载 Instrumenting-with-mlflow-tracing 技能。涵盖端到端评估工作流程或单个组件(跟踪设置、数据集创建、评分器定义、评估执行)。

更新日志: Source: GitHub https://github.com/mlflow/skills

目录结构

当前层级: tree/main/agent-evaluation/

  • 📁 assets/
    • 📄 evaluation_report_template.md 4.4 KB
  • 📁 references/
    • 📄 dataset-preparation.md 9.7 KB
    • 📄 scorers-constraints.md 6.0 KB
    • 📄 scorers.md 10.7 KB
    • 📄 setup-guide.md 6.1 KB
    • 📄 throughput-guide.md 5.5 KB
    • 📄 troubleshooting.md 23.9 KB
  • 📁 scripts/
    • 📁 utils/
      • 📄 __init__.py 365 B
      • 📄 env_validation.py 3.5 KB
    • 📄 analyze_results.py 19.0 KB
    • 📄 create_dataset_template.py 13.4 KB
    • 📄 list_datasets.py 8.7 KB
    • 📄 run_evaluation_template.py 9.7 KB
    • 📄 setup_mlflow.py 9.5 KB
    • 📄 validate_auth.py 7.3 KB
    • 📄 validate_environment.py 5.1 KB
    • 📄 validate_tracing_runtime.py 11.0 KB
  • 📄 SKILL.md 20.5 KB

SKILL.md

登录后下载/点赞/收藏 ❤ 20 | ★ 0
评论 0

请先登录后评论。

评论加载中...