Skip to content

我准备开一门 Agent Skills 的在线实战课程,年前开课!

Published:

Skills 在未来的生命力,可能会远远超过我们熟知的各种“提示词技巧”。

01

2026,从 Prompt 到 Skills

新的一年,每个人都有一些新的学习计划。

2026 年,如果只推荐一项必学的 AI 技能,我会毫不犹豫地首推 Agent Skills(智能体技能)。

早在去年 10 月,Anthropic 推出 Agent Skills 时,我就感觉到这不是一次简单的功能更新,而是迎来一种全新的 AI 应用方式。

几个月的实践与探索下来,这种感觉愈发强烈:Skills 在未来的生命力,可能会远远超过我们熟知的各种“提示词技巧”。

到目前为止,我们熟知的一些工具:Codex、Gemini CLI、Opencode 都已将 Skills 纳入核心工作流;国内的 Coze、Trae 也紧随其后,陆续开放对 Skills 的支持。

甚至有人通过逆向工程发现,强大的 ChatGPT 背后,早已默默运行着大量的 Skills 来支撑其高级功能。

去年 12 月,Agent Skills 正式成为开放标准。

这意味着,它不再是某个大厂的独门绝技,而是我们每个人都可以掌握、可以构建的通用能力。

我也赶在过年前,准备开设一门 Agent Skills 的在线实战课程

这篇文章,既是一篇关于 Skills 的科普文,也算是这门课程的招生宣传文。

02

什么是 Agent Skills?

Prompt 是让 AI “想”,Skills 是让 AI “做”。

如果把 AI 比作一个刚入职的实习生,那么:

Skills,直译过来就是技能,你可以将其理解为 结构化的知识与工作流组合包

1. Skills 目录结构

从底层的技术实现来看,Skill 并没有什么黑科技,它本质上就是一个文件夹。但这个文件夹里,装着 AI 的“大脑回路”和“手脚”。

一个标准的 Skill 文件夹通常包含以下核心要素:

  1. SKILL.md(大脑)

    这是 Skill 的核心配置文件。它包含了元数据和详细的操作指南。它告诉 AI:“我是谁?我能干什么?在什么情况下你应该调用我?调用我的时候需要注意什么?”

  2. 脚本 Scripts(手脚)

    这是 Python、JavaScript 或其他语言编写的可执行代码。Prompt 只能生成文本,但脚本可以下载文件、处理 Excel、调用 API、生成图表。这是 AI 能够“干活”的关键。

  3. 资产 Assets(物料)

    这里存放着各种模板、图片素材、文档规范等。比如你让 AI 写文章,这里可以放你们公司的“排版规范文档”;你让 AI 做图,这里可以放“品牌 Logo”。

下面是一个典型的 Skills 的目录结构:

your-skill-name
├── SKILL.md  	# 必选
├── assets			# 可选
   ├── illustrator-ref.jpg
   └── report-template.md
├── references	# 可选
   └── api-guide.md
└── scripts			# 可选
    └── process_data.py

2. 为什么 Prompt 不够用了?

你可能会问:“我用 Prompt 也能让 AI 干活啊,为什么要搞这么复杂?”

区别在于粒度和确定性

Prompt 是线性的、一次性的交互。你每次都要把背景信息、要求、格式作为上下文重新发给 AI。

一旦任务稍微复杂一点,比如“先去网上搜集信息,整理成表格,然后画个图,最后发邮件”,Prompt 往往会顾此失彼,或者因为上下文太长而产生幻觉。

Skills 的粒度更大。它不是一段简单的文字说明,它是一套完全特定任务的分步工作流程

要完成这套流程,AI 可能会:

Prompt 是让 AI 想,Skills 是让 AI 做。

03

一个真实的 Skills 工作流案例

这就是 Skills 的魅力:模块化、自动化、可复用。

为了让大家更直观地理解 Skills 的威力,我们来看一个课程中会详细拆解的真实案例。

场景需求

你需要运营一个公众号,每天的任务是:找一个国外的优质 Youtube 英文视频,把它转化成一篇深度的中文解读文章,并且配好图。

1. 传统模式(Prompt 流程)

如果你只用 AI 对话框,你的操作流程是这样的:

  1. 自己想办法用第三方工具下载字幕。
  2. 把字幕复制粘贴给 AI(如果字幕太长,还要分段粘贴)。
  3. 写一段 Prompt 让 AI 翻译并总结。
  4. 再写一段 Prompt 让 AI 改写成文章风格。
  5. 再写一段 Prompt 让 AI 生成配图提示词。
  6. 把提示词复制到 Nanobanana Pro 去生成图片。
  7. 下载图片,复制文章,去排版。

这一套下来,至少需要一个小时,而且中间任何一步都需要你人工干预。

2. 新模式(Skills 流程)

在我们的课程中,会通过构建一套 Skills 来解决这个问题。

这套流程被拆解为几个独立的 Skill,就像流水线上的机械臂:

  1. Skill A: srt-dl(字幕搬运工)
    • 功能:你给它一个 URL,它自动调用 Python 脚本下载视频字幕文件到本地。
  2. Skill B: transcript-to-draft(初稿整理师)
    • 功能:读取本地字幕文件,根据预设的结构化 Prompt,将其转化为文章初稿。
  3. Skill C: draft-to-article(文章润色师)
    • 功能:读取初稿,根据你提供的“写作风格指南”,对文章进行润色、格式化处理。
  4. Skill D: article-illustrator-generator(插画设计师)
    • 功能:分析文章内容,自动提取关键画面描述,调用绘图模型生成配图。

最后,我们拥有一个总指挥技能:它负责把上面四个 Skill 串联起来。

现在,你的工作流变成了:

给 AI 发一个 YouTube 链接 → 等待 5 分钟 → 收到一篇带配图的完整中文文章。

更酷的是,这些 Skills 也是模块化的。

某天你自己写了一篇文章,想配个图,你不需要走全套流程,只需要单独调用 article-illustrator-generator 这个技能,它立刻就能为这篇文章生成配图。

这就是 Skills 的魅力:模块化、自动化、可复用。

04

渐进式披露优势

真正的智能,是按需加载与无限扩展的艺术。

在 AI 的使用中,有一个让所有开发者和重度用户头疼的问题:上下文窗口(Context Window)不够用。

不管现在的模型号称支持多大的上下文,如果你每次对话都把几十个工具的说明全部塞进去,不仅会消耗大量的 Token,更致命的是会导致模型“注意力分散”。

模型就像人一样,给它的信息越多,它越容易忽略关键细节,产生“幻觉”。

Agent Skills 巧妙地引入了“渐进式披露”设计理念。

这就好比你去图书馆借书。图书馆有几十万本书(Skills),但你进门的时候,管理员不会把几十万本书都堆在你桌上。

Skills 的加载分为三个阶段:

  1. 第一阶段:索引

    当系统启动时,它只加载所有 Skill 的 名称简短描述

    • AI 此时只知道:哦,我有下载字幕文章配图生成PDF这几个技能可以用。
    • 消耗 Token:极少。
  2. 第二阶段:读取手册

    当你对 AI 说:帮我处理这个视频链接。 AI 意识到需要用到“下载字幕”这个技能,它才会去加载该 Skill 对应的 SKILL.md 文件,阅读具体的操作指南。

    • 消耗 Token:中等,仅在需要时产生。
  3. 第三阶段:调用资源

    只有当 SKILL.md 中明确指出需要运行某个 Python 脚本,或者参考某个具体的 PDF 文档时,系统才会去读取这些“重资产”。

    • 消耗 Token:精准投放。

这种机制极其高效。

它允许你在你的 AI 助手里挂载成百上千个 Skill,从写代码到查天气,从分析财报到推荐食谱,却几乎不占用初始的上下文空间。

这真正实现了 AI 能力的“按需加载”与“无限扩展”。

05

为什么你需要掌握 Skills?

普通人做加法,高手都在找杠杆。

Skills 并不是程序员的专属玩具,它完美解决了实际应用中的三个核心痛点:

1. 注入领域专业性

通用大模型(如 DeepSeek)知道如何“做数据分析”,但它不知道“你们公司”是如何做数据分析的,它不知道你们的表头定义,也不知道你们的报表格式。

通过 Skills,你可以把公司的程序性知识注入给 AI。

你可以告诉它:“在我们公司,处理数据必须先过滤掉某列为空的行。”

2. 驯服非确定性系统

大模型本质上是一个概率模型,它的输出是非确定性的(每次回答都不太一样)。这在闲聊时是惊喜,在工作中很容易就是灾难。

通过 Skills 中定义的严谨步骤,我们可以强行约束 AI 的行为路径,让这个非确定性的系统,稳定地输出我们需要的确定性结果

3. 赋予新能力

通过关联本地脚本,Skills 可以让 AI 完成它原本绝对做不到的任务。

大模型本身不能联网下载文件,不能操作你电脑上的 Excel。但 Skills 可以作为桥梁,连接 AI 的大脑和外部世界的 API。

总结来说,Skills 是:低门槛(易用性) + 高天花板(可扩展性)。

打个比方:

你刚买来的手机(Agent)可能只会打电话。

现在的开源社区,已经涌现了大量高质量的 Skills:自动剪辑视频、自动生成 PPT、全网热点抓取… 你只需要拿来用,通过叠加和组合,你的手机就不仅仅是个电话,而是你的超级管家。


06

课程:手把手带你打造 AI 助手

我把你可能需要花 3 个月摸索的坑,浓缩在 8 节课里填平。

聊了这么多理念,终于要进入正题了。

我知道很多读者看完了上面的内容,心里会想:“说明我都能看懂,但我不会写代码,怎么弄?”

这也是我开设这门 《Agent Skills 实战构建指南》 的初衷。

1. 课程初心

在设计这门课的时候,我不断问自己一个问题:“如果回到三个月前,我希望有一门什么样的课,能带我少走弯路?”

回应这个问题,我希望这门课:

  1. 门槛足够低:不讲晦涩的底层原理,只讲怎么用。尽可能让所有愿意学的人,无论文科理科,都能快速上手。
  2. 由浅入深:从最简单的 Hello World 开始,既了解标准,又能从零开始创建自己的第一个 Skill。
  3. 真实、真实、还是真实:拒绝为了演示而演示的玩具案例。所有案例都来自真实的生产环境,会涉及到很多只有在工程实践中才会踩到的坑和积累的经验。

2. 课程大纲(动态调整中)

这是目前的规划内容,但我希望课程是“活”的。

如果在上课过程中发现某个新的技术点对大家更有价值,我们会随时调整内容。

课时安排:保底 8 次直播课,每次课 90 分钟。

3. 课程特色

重要提示:严格意义上来说,如果你自己愿意花大量时间去啃官方文档、去 GitHub 翻阅开源项目、去 Twitter 搜集碎片化教程,你是完全可以通过自学掌握这些内容的。因为我也是这么学过来的。

这门课能帮到什么呢?帮你节省时间和积累经验

我把你可能需要花 3 个月摸索的坑,浓缩在 8 节课里填平。所有示例都来自于我在生产环境的真实应用,这些实战细节也是文档里不会写的。

07

课前准备与要求

模型是大厦的地基,直接决定了 Skills 输出质量的上限。

很多同学担心工具和环境配置安装,这里做一点说明。

1. 工具和服务

其实不用太担心,预估上课人数不会多到顾不过来,我会尽可能照顾到每一个人的环境配置。

如果有必要,我会额外加一堂课专门讲环境安装。

本次课程主要涉及的工具:

锦上添花的工具和服务(课程会用到,推荐,但对于跑流程非必须):

2. 关于 AI 模型

对于 AI 大模型选择来说,我一贯建议是:在经济和条件允许的范围内,尽可能使用最好的模型。

模型直接决定了你 Skills 输出质量的上限。当然,纯从学习逻辑的角度,模型不是卡点,国产大模型现在也非常优秀,完全可以跑通流程。

在课程中,我尽可能会多演示不同大模型的输出效果,这样大家有一个直观的感受,对大家去做选择也有一些帮助。

下面是在课程中会演示到的一些大模型:

:原则上,你需要具备基础的解决问题的能力,比如注册账号、下载软件等。遇到问题我会给建议,但无法代劳。

08

费用及报名

开课时间

双重福利:

退费承诺:

哪怕你在看到这篇文章时,课程已经开始甚至结束了,依然可以直接购买。录屏回放和资料包一样不少,社群大门依然为你敞开。

09

结语

种一棵树最好的时间是十年前,其次是现在。

技术发展的速度快得让人眩晕。

以前我们说种一棵树最好的时间是十年前,其次是现在

在 AI 时代,这句话变成了:掌握一项技能最好的时间是它刚成为标准的时候。

Agent Skills 刚刚起步,现在正是入局的最佳窗口期。希望我们能一起,做第一批“吃螃蟹”并被螃蟹滋养的人。

我们课上见。

购课请加微信咨询


下一篇
聊一聊关于育儿的一点实践和个人偏见,贵在真实