- 📄 SKILL.md
approach-evaluation
研究行业标准和最佳实践,确定针对给定技术或架构问题的可行方法,并根据项目特定的限制进行结构化的事实比较。报告选项——不做决定。
研究行业标准和最佳实践,确定针对给定技术或架构问题的可行方法,并根据项目特定的限制进行结构化的事实比较。报告选项——不做决定。
自动执行浏览器交互以进行 Web 测试、表单填写、屏幕截图和数据提取。当用户需要导航网站、与网页交互、填写表单、截取屏幕截图、测试 Web 应用程序或从网页中提取信息时使用。
在为 @copilotkit/llmock 编写测试装置时使用 - 模拟 LLM 响应、工具调用序列、错误注入、多轮代理循环、嵌入、结构化输出、顺序响应或调试装置不匹配
在修改 Codex SPECTER 安装流程、SessionStart 连续性、项目技能同步、注册表注入或 Codex 特定的运行时文件时使用。
重构臃肿的 AGENTS.md、CLAUDE.md 或类似的代理指令文件,以遵循渐进公开原则。将整体文件拆分为有组织的、链接的文档。
每天自动更新 Clawdbot 和所有已安装的技能。通过 cron 运行,检查更新,应用更新,并向用户发送有关更改内容的摘要的消息。
用于对生物样本、特征或任何定量数据矩阵进行聚类的系统工作流程。通过严格的验证、比较和解释来实现多种聚类算法,以识别有意义的数据分组。
使用 Salesforce Agent Script(用于使用 Atlas Reasoning Engine 创作 Agentforce 代理的脚本语言)时使用此技能。触发器包括:创建、修改或理解Agent Script代理;使用 AiAuthoringBundle 文件或 .agent 文件;设计主题图或流程控制;制定或更新代理规范;验证代理脚本或诊断编译错误;预览代理或调试行为问题;部署、发布、激活或停用代理;删除或重命名代理;编写 AiEvaluationDefinition 测试规范或运行代理测试。这项技能从头开始教授代理脚本 - 人工智能模型对此语言的先前训练数据为零。请勿用于 Apex 开发、流程构建、提示模板创作、Experience Cloud 配置或与代理脚本无关的常规 Salesforce CLI 任务。
长期运行的利爪殖民地特工的技能包。在加入群体、决定要做什么、阅读邮件、路由到领域技能或开始新会话时使用。不适用于利爪殖民地之外的一次性任务。
根据黄金参考对座席行为进行评估和评分。每当用户想要运行评估、检查通过/失败状态、了解指标分数、比较会话的回归、验证代理行为或对文件或实时会话的跟踪进行评分时,请使用此技能。触发诸如“评估此跟踪”、“检查我的代理输出”、“我的代理是否做了正确的事情”、“比较运行”、“我的代理回归了吗”、“对会话 X 进行评分”、“针对黄金进行评估”、“运行评估”等短语。适用于本地跟踪文件和实时流会话。 --- 评估代理行为并解释分数的含义。 ## 确定输入类型 首先,确定要评估的内容: - **跟踪文件** — 用户提及 `.json` 或 `.jsonl` 文件路径 → 使用 `evaluate_traces` - **Sessions 与 Golden** — 用户有多个实时会话并希望进行回归测试 → 使用 `evaluate_sessions` - **单个实时会话** — 用户希望针对黄金评估集对一个会话进行评分 → 指导他们将 `evaluate_sessions` 与一个会话一起使用Golden ## 评估跟踪文件 1. 获取文件路径。检查扩展名: `.jsonl` → `trace_format: "otlp-json"` | `.json` → `"jaeger-json"`(默认) 2. 询问他们是否有黄金评估集 JSON。对于“tool_trajectory_avg_score”(默认指标),需要一个评估集 - 它提供了要进行比较的预期工具调用序列。 如果他们还没有,请解释这一点并建议从“hallucinations_v1”开始,或者询问他们是否想首先从参考运行中创建一个黄金集。 3. 使用文件、格式和评估集调用“evaluate_traces”。 4. 以分数表形式呈现结果(请参阅下面的分数解释)并解释失败的原因。 ## 评估会话(回归测试) 此工作流程要求服务器使用“--dev”标志运行(启用 WebSocket 和会话流)。普通的“agentevasserve”不会有会话。如果您从下面的任何工具中收到连接错误,请告诉用户:``bash uv run agentevalsserve --dev``
创建有效技能的指南,通过专业知识、工作流程或工具集成来扩展代理的能力。当用户要求执行以下操作时,请使用此技能:(1) 创建新技能,(2) 创建技能,(3) 构建技能,(4) 设置技能,(5) 初始化技能,(6) 搭建技能,(7) 更新或修改现有技能,(8) 验证技能,(9) 了解技能结构,(10) 了解技能如何工作,或 (11) 获得有关技能设计模式的指导。触发诸如“创建一项技能”、“新技能”、“制定一项技能”、“X 的技能”、“我如何创建一项技能”或“帮助我建立一项技能”等短语。
针对 AI 安全问题进行深度代码扫描 — 提示注入、提示中的 PII、硬编码密钥、无人看守的代理。
skill-sample/ ├─ SKILL.md ⭐ 必备:技能说明入口:用途 / 安装 / 用法 / 示例 / 依赖 ├─ manifest.sample.json ⭐ 推荐:机器可读元信息:用于索引 / 校验 / 自动填表 ├─ LICENSE.sample ⭐ 推荐:授权与使用范围:开源 / 限制 / 商用说明 ├─ scripts/ │ └─ example-run.py ✅ 可运行示例脚本:让用户导入后立刻验证“能用” ├─ assets/ │ ├─ example-formatting-guide.md 🧩 输出规范:统一排版 / 结构 / 风格 │ └─ example-template.tex 🧩 模板资源:报告/文档模板,快速生成标准产物 └─ references/ 🧩 参考资料库:方法论 / 结构指南 / 最佳实践 ├─ example-ref-structure.md 🧩 结构参考:章节框架 / 目录组织 ├─ example-ref-analysis.md 🧩 分析参考:常用套路 / 指标口径 └─ example-ref-visuals.md 🧩 视觉参考:图表规范 / 可视化建议
更多 Agent Skills 规范 详见Anthropic官方文档:https://agentskills.io/home
├─ ⭐ 必备:YAML Frontmatter(必须存在,放在文件最顶部) │ ├─ ⭐ name :技能唯一名;须符合命名规则,并建议与目录名一致 │ └─ ⭐ description :技能描述;建议包含触发关键词(便于检索/匹配) │ ├─ ✅ 可选:Frontmatter 扩展字段(规范允许,但非强制) │ ├─ ✅ license :许可证标识(也可配合单独 LICENSE 文件) │ ├─ ✅ compatibility :兼容性/运行环境要求(仅在确实有限制时写) │ ├─ ✅ metadata :任意键值对(如 author/version/source_url 等) │ └─ 🧩 allowed-tools :允许工具白名单(规范标注为 experimental) │ └─ ✅ 推荐:Markdown 正文(自由格式,但建议按“渐进式披露”组织) ├─ ✅ Overview / Purpose :一句话说明目标 + 不做什么(边界) ├─ ✅ When to use :触发条件/适用场景(让模型/用户知道何时调用) ├─ ✅ Step-by-step :步骤化流程(最好 3–6 步,保证可复现) ├─ ✅ Inputs / Outputs :输入格式、输出格式、产物位置(文件/文本/JSON等) ├─ ✅ Examples :至少 1 个可复制示例(越“能跑”越好) ├─ 🧩 Files & References :引用assets/、references/、scripts/(相对路径) ├─ 🧩 Edge cases :边界情况/限制(大文件、速率限制、失败回退) ├─ 🧩 Troubleshooting :常见错误与解决(依赖缺失、路径不对、权限问题) └─ 🧩 Safety notes :涉及联网/写文件/执行命令时给出提醒(建议写)
在 GitHub 和各类社区里,技能文件分散、难检索、也难判断是否可靠。SkillWink 把开源技能集中整理成可搜索、可筛选、可直接下载使用的技能库,让你更快找到“正好能用”的那一个。并且支持在SkillWink上直接上传skills。
我们提供 AI 语义搜索 + 关键字检索,支持 版本更新与多维排序(下载/点赞/评论/更新),并为每个技能提供 SKILL.md 开放标准与来源信息。你还可以在详情页直接 评论讨论、交流用法与改进建议。
快速上手:
支持下载与导入 skills(.zip/.skill),本地放置后即可生效:
~/.claude/skills/(Claude Code)
~/.codex/skills/(Codex CLI)
~/.gemini/skills/(Gemini CLI)
同一份 SKILL.md 跨平台通用。
你需要了解的:技能是什么、怎么运行的、怎么找、怎么导入、怎么判断可信、怎么参与共建。
这里的“skills(技能)”是一种可复用的任务能力包,通常包含 SKILL.md 说明(用途、输入输出、使用方法)以及可选的脚本/模板/示例文件。
你可以把它理解为:给 AI 助手或工具链用的“插件说明书 + 资源包”,可被反复安装与分享。
技能系统采用“渐进式披露”策略,高效管理上下文信息,具体流程如下:
发现阶段:系统启动时,智能体仅加载各技能的名称与简要描述——信息精简,足以判断其适用场景,避免冗余加载。
激活阶段:当任务需求与某技能描述匹配时,智能体才将对应的完整 SKILL.md 说明文档动态载入上下文。
执行阶段:智能体严格遵循文档指引执行操作,并按需调用关联文件或运行内置代码模块。
核心优势:该设计使智能体始终保持轻量高效,同时具备“按需扩展上下文”的能力,既保障响应速度,又确保复杂任务拥有充分执行依据。
推荐 3 种方式组合使用:
注:以上导入方式文件大小控制在10M之内。
常见路径如下(不同系统略有差异,以你本机为准):
同一份 SKILL.md 通常可以跨工具复用。你在 SkillWink 导入后,也可以查看“放置指引/安装说明”。
可以。很多技能本质是标准化说明 + 资源,只要目标工具支持读取该格式,就能共享使用。
比如:检索类技能 + 写作类技能 + 自动化脚本,形成“发现 → 处理 → 输出”的工作流。
一部分skills来源于公开的 GitHub 仓库。我们会筛掉低质量仓库(至少 2 星),并扫描基本质量指标,还有一部分是SkillWink平台的创作者独立上传的。作为使用者,在安装前应始终审查代码,对安全问题负责。
最常见原因是这几类:
我们会尽量避免。你可以用 排序 + 评论 让“好用的”更靠前: