- 📁 references/
- 📄 SKILL.md
harness-eval
当用户要求“测试工具”、“运行集成测试”、“使用真实 API 验证功能”、“使用真实模型调用进行测试”、“运行代理循环测试”、“验证端到端”或需要使用实际 LLM 调用在真实代码库上验证 OpenHarness 功能时,应使用此技能。
当用户要求“测试工具”、“运行集成测试”、“使用真实 API 验证功能”、“使用真实模型调用进行测试”、“运行代理循环测试”、“验证端到端”或需要使用实际 LLM 调用在真实代码库上验证 OpenHarness 功能时,应使用此技能。
当用户要求“测试 saas 跨存储库功能”、“将功能分支部署到暂存”、“针对 OH Cloud 分支测试 SDK”、“e2e 测试云工作区功能”、“测试机密 saas 继承”时,或者当更改跨越 SDK 和 OpenHands 企业并需要针对暂存部署进行端到端验证时,应使用此技能。
创建一个临时的真实项目并证明 Prove_it 功能端到端有效(或无效)。 Builds a disposable git repo, writes a focused config, runs real dispatches through the installed or local prove_it, and produces a human-readable session transcript.当您需要证明某个功能、重现错误或针对真实项目(而不仅仅是单元测试)验证修复时使用。 --- # 证明某个功能有效(或无效) 构建一个一次性项目,并通过真正的调度程序管道来执行 Prove_it 功能。输出是人类可读的文字记录,用户可以阅读以确认系统端到端运行。 ## “证明”的含义 - 首先阅读本文 **证明功能意味着观察该功能执行其实际工作,而不仅仅是观察调度程序接受配置并返回决定。** 如果该功能是检测死代码的审阅者,您必须: 1. 创建一个 **包含死代码** 的项目 → 运行审核器 → 查看它 **捕获** 死代码 2. 创建一个 **没有死代码** 的项目 → 运行审核器 → 查看它 **通过干净** 如果该功能是验证 API 设计的任务,您必须: 1. 编写一个具有 **真实设计违规** 的 API 文件 → 查看该任务 **拒绝** 它 2. 编写一个干净的 API 文件 → 查看该任务 **批准** 它 如果该功能是一个条件条件门,您必须: 1. 以**未满足**的条件运行 → 查看任务 **被跳过** 2. 以 **满足**的条件运行 → 查看任务 **实际执行并产生其真实输出**
构建人工智能和机器学习产品决策,包括模型选择、数据要求、评估框架和负责任的人工智能考虑因素。在构建 AI 支持的功能、评估 LLM 集成、设计 AI 产品或评估 AI 准备情况时使用。触发“AI 产品”、“LLM 功能”、“AI 画布”、“AI 构建”、“AI 集成”、“AI 驱动”、“机器学习功能”。
交互式采访来填充工件目录。遍历领域、功能、基础设施、决策和未知数。在项目开始或添加功能时使用。
并行处理多个功能或任务。跨功能批量执行PDCA命令。
通过复制规范的“tasks”模块模板来创建新的功能模块。在向应用程序添加新模块、从头开始构建新域区域或生成新功能的样板时使用。
通过复制规范的“tasks”模块模板来创建新的功能模块。在向应用程序添加新模块、从头开始构建新域区域或生成新功能的样板时使用。
使用代理工具来规划和执行功能请求、错误修复和改进。自动检测用户何时分享反馈、错误报告或功能请求并自动进入分类模式。创建包含验收标准的每票计划,然后使用执行者 + 评估者模式来实施和验证每个任务。
在向 Valor 系统添加新功能、技能、工具或 MCP 服务器时使用。由“添加功能”、“创建新工具”、“扩展系统”或“如何添加...”触发。
产品负责人的功能规范技能。当您需要定义业务需求、编写用户故事、验收标准、待办事项优先级或任何产品规范文档时使用。触发:“新功能”、“规范”、“用户故事”、“需求”、“待办事项”、“PO”、“定义范围”、“验收标准”、“MVP”、“路线图”。 --- # 产品负责人 - 功能规范 PO 是商业价值的守护者。每个新功能都从这里开始。 ## 全局治理 该技能遵循 `GLOBAL.md`、`policies/execution.md`、`policies/handoffs.md`、`policies/token-efficiency.md` 和 `policies/evals.md`。如需长示例和完整清单,请仅在必要时查阅“docs/skill-guides/po-feature-spec.md”。 ## 何时使用 - 定义新功能、范围和优先级 - 将业务需求转化为可测试的标准 ## 何时不使用 - 决定详细的技术实现 - 替换 UI/UX、后端、QA 或审阅者 ## 预期输入 - 业务目标 - 已知限制和依赖项 - 用户或操作上下文 ## 预期输出 - 简短且可操作的规范 - 可测试的验收标准 - 明确移交给 UI/UX 和下一个管道 ## 职责 1. 将业务需求转化为可使用的技术规范团队 2. 定义优先级和影响 3. 编写清晰且可测试的验收标准 4. 验证最终交付是否满足预期 ## 最低功能规范结构 每个新功能必须至少涵盖: - 问题摘要和建议的解决方案 - 具有可测试验收标准的用户故事 - 业务规则和依赖关系 - “IN”和“OUT”范围 - 优先级和成功指标 有关完整规范和广泛示例,请参阅“docs/skill-guides/po-feature-spec.md”。 ## 验收标准 - 良好实践 验收标准必须是: - **具体**:没有歧义 - **可衡量**:可以验证如所见
为新功能生成产品需求文档 (PRD)。在规划功能、启动新项目或要求创建 PRD 时使用。触发条件:创建 prd、为其编写 prd、规划此功能、需求、规格。
skill-sample/ ├─ SKILL.md ⭐ 必备:技能说明入口:用途 / 安装 / 用法 / 示例 / 依赖 ├─ manifest.sample.json ⭐ 推荐:机器可读元信息:用于索引 / 校验 / 自动填表 ├─ LICENSE.sample ⭐ 推荐:授权与使用范围:开源 / 限制 / 商用说明 ├─ scripts/ │ └─ example-run.py ✅ 可运行示例脚本:让用户导入后立刻验证“能用” ├─ assets/ │ ├─ example-formatting-guide.md 🧩 输出规范:统一排版 / 结构 / 风格 │ └─ example-template.tex 🧩 模板资源:报告/文档模板,快速生成标准产物 └─ references/ 🧩 参考资料库:方法论 / 结构指南 / 最佳实践 ├─ example-ref-structure.md 🧩 结构参考:章节框架 / 目录组织 ├─ example-ref-analysis.md 🧩 分析参考:常用套路 / 指标口径 └─ example-ref-visuals.md 🧩 视觉参考:图表规范 / 可视化建议
更多 Agent Skills 规范 详见Anthropic官方文档:https://agentskills.io/home
├─ ⭐ 必备:YAML Frontmatter(必须存在,放在文件最顶部) │ ├─ ⭐ name :技能唯一名;须符合命名规则,并建议与目录名一致 │ └─ ⭐ description :技能描述;建议包含触发关键词(便于检索/匹配) │ ├─ ✅ 可选:Frontmatter 扩展字段(规范允许,但非强制) │ ├─ ✅ license :许可证标识(也可配合单独 LICENSE 文件) │ ├─ ✅ compatibility :兼容性/运行环境要求(仅在确实有限制时写) │ ├─ ✅ metadata :任意键值对(如 author/version/source_url 等) │ └─ 🧩 allowed-tools :允许工具白名单(规范标注为 experimental) │ └─ ✅ 推荐:Markdown 正文(自由格式,但建议按“渐进式披露”组织) ├─ ✅ Overview / Purpose :一句话说明目标 + 不做什么(边界) ├─ ✅ When to use :触发条件/适用场景(让模型/用户知道何时调用) ├─ ✅ Step-by-step :步骤化流程(最好 3–6 步,保证可复现) ├─ ✅ Inputs / Outputs :输入格式、输出格式、产物位置(文件/文本/JSON等) ├─ ✅ Examples :至少 1 个可复制示例(越“能跑”越好) ├─ 🧩 Files & References :引用assets/、references/、scripts/(相对路径) ├─ 🧩 Edge cases :边界情况/限制(大文件、速率限制、失败回退) ├─ 🧩 Troubleshooting :常见错误与解决(依赖缺失、路径不对、权限问题) └─ 🧩 Safety notes :涉及联网/写文件/执行命令时给出提醒(建议写)
在 GitHub 和各类社区里,技能文件分散、难检索、也难判断是否可靠。SkillWink 把开源技能集中整理成可搜索、可筛选、可直接下载使用的技能库,让你更快找到“正好能用”的那一个。并且支持在SkillWink上直接上传skills。
我们提供 AI 语义搜索 + 关键字检索,支持 版本更新与多维排序(下载/点赞/评论/更新),并为每个技能提供 SKILL.md 开放标准与来源信息。你还可以在详情页直接 评论讨论、交流用法与改进建议。
快速上手:
支持下载与导入 skills(.zip/.skill),本地放置后即可生效:
~/.claude/skills/(Claude Code)
~/.codex/skills/(Codex CLI)
~/.gemini/skills/(Gemini CLI)
同一份 SKILL.md 跨平台通用。
你需要了解的:技能是什么、怎么运行的、怎么找、怎么导入、怎么判断可信、怎么参与共建。
这里的“skills(技能)”是一种可复用的任务能力包,通常包含 SKILL.md 说明(用途、输入输出、使用方法)以及可选的脚本/模板/示例文件。
你可以把它理解为:给 AI 助手或工具链用的“插件说明书 + 资源包”,可被反复安装与分享。
技能系统采用“渐进式披露”策略,高效管理上下文信息,具体流程如下:
发现阶段:系统启动时,智能体仅加载各技能的名称与简要描述——信息精简,足以判断其适用场景,避免冗余加载。
激活阶段:当任务需求与某技能描述匹配时,智能体才将对应的完整 SKILL.md 说明文档动态载入上下文。
执行阶段:智能体严格遵循文档指引执行操作,并按需调用关联文件或运行内置代码模块。
核心优势:该设计使智能体始终保持轻量高效,同时具备“按需扩展上下文”的能力,既保障响应速度,又确保复杂任务拥有充分执行依据。
推荐 3 种方式组合使用:
注:以上导入方式文件大小控制在10M之内。
常见路径如下(不同系统略有差异,以你本机为准):
同一份 SKILL.md 通常可以跨工具复用。你在 SkillWink 导入后,也可以查看“放置指引/安装说明”。
可以。很多技能本质是标准化说明 + 资源,只要目标工具支持读取该格式,就能共享使用。
比如:检索类技能 + 写作类技能 + 自动化脚本,形成“发现 → 处理 → 输出”的工作流。
一部分skills来源于公开的 GitHub 仓库。我们会筛掉低质量仓库(至少 2 星),并扫描基本质量指标,还有一部分是SkillWink平台的创作者独立上传的。作为使用者,在安装前应始终审查代码,对安全问题负责。
最常见原因是这几类:
我们会尽量避免。你可以用 排序 + 评论 让“好用的”更靠前: