
01
2026,从 Prompt 到 Skills
新的一年,每个人都有一些新的学习计划。
2026 年,如果只推荐一项必学的 AI 技能,我会毫不犹豫地首推 Agent Skills(智能体技能)。
早在去年 10 月,Anthropic 推出 Agent Skills 时,我就感觉到这不是一次简单的功能更新,而是迎来一种全新的 AI 应用方式。
几个月的实践与探索下来,这种感觉愈发强烈:Skills 在未来的生命力,可能会远远超过我们熟知的各种“提示词技巧”。
到目前为止,我们熟知的一些工具:Codex、Gemini CLI、Opencode 都已将 Skills 纳入核心工作流;国内的 Coze、Trae 也紧随其后,陆续开放对 Skills 的支持。
甚至有人通过逆向工程发现,强大的 ChatGPT 背后,早已默默运行着大量的 Skills 来支撑其高级功能。
去年 12 月,Agent Skills 正式成为开放标准。
这意味着,它不再是某个大厂的独门绝技,而是我们每个人都可以掌握、可以构建的通用能力。
我也赶在过年前,准备开设一门 Agent Skills 的在线实战课程。
这篇文章,既是一篇关于 Skills 的科普文,也算是这门课程的招生宣传文。
02
什么是 Agent Skills?

如果把 AI 比作一个刚入职的实习生,那么:
- Prompt(提示词) 是你对他说的“一句话指令”。比如:“帮我写个日报”。
- Skills(技能) 则是你塞给他的一本“标准化操作手册(SOP)+ 工具箱”。
Skills,直译过来就是技能,你可以将其理解为 结构化的知识与工作流组合包。
1. Skills 目录结构
从底层的技术实现来看,Skill 并没有什么黑科技,它本质上就是一个文件夹。但这个文件夹里,装着 AI 的“大脑回路”和“手脚”。
一个标准的 Skill 文件夹通常包含以下核心要素:
-
SKILL.md(大脑):
这是 Skill 的核心配置文件。它包含了元数据和详细的操作指南。它告诉 AI:“我是谁?我能干什么?在什么情况下你应该调用我?调用我的时候需要注意什么?”
-
脚本 Scripts(手脚):
这是 Python、JavaScript 或其他语言编写的可执行代码。Prompt 只能生成文本,但脚本可以下载文件、处理 Excel、调用 API、生成图表。这是 AI 能够“干活”的关键。
-
资产 Assets(物料):
这里存放着各种模板、图片素材、文档规范等。比如你让 AI 写文章,这里可以放你们公司的“排版规范文档”;你让 AI 做图,这里可以放“品牌 Logo”。
下面是一个典型的 Skills 的目录结构:
your-skill-name
├── SKILL.md # 必选
├── assets # 可选
│ ├── illustrator-ref.jpg
│ └── report-template.md
├── references # 可选
│ └── api-guide.md
└── scripts # 可选
└── process_data.py
2. 为什么 Prompt 不够用了?
你可能会问:“我用 Prompt 也能让 AI 干活啊,为什么要搞这么复杂?”
区别在于粒度和确定性。
Prompt 是线性的、一次性的交互。你每次都要把背景信息、要求、格式作为上下文重新发给 AI。
一旦任务稍微复杂一点,比如“先去网上搜集信息,整理成表格,然后画个图,最后发邮件”,Prompt 往往会顾此失彼,或者因为上下文太长而产生幻觉。
而 Skills 的粒度更大。它不是一段简单的文字说明,它是一套完全特定任务的分步工作流程。
要完成这套流程,AI 可能会:
- 自动调取特定的 Prompt。
- 访问你本地的某个文件。
- 调用外部的检索 API。
- 执行一段 Python 代码来重命名文件。
Prompt 是让 AI 想,Skills 是让 AI 做。
03
一个真实的 Skills 工作流案例

为了让大家更直观地理解 Skills 的威力,我们来看一个课程中会详细拆解的真实案例。
场景需求:
你需要运营一个公众号,每天的任务是:找一个国外的优质 Youtube 英文视频,把它转化成一篇深度的中文解读文章,并且配好图。
1. 传统模式(Prompt 流程)
如果你只用 AI 对话框,你的操作流程是这样的:
- 自己想办法用第三方工具下载字幕。
- 把字幕复制粘贴给 AI(如果字幕太长,还要分段粘贴)。
- 写一段 Prompt 让 AI 翻译并总结。
- 再写一段 Prompt 让 AI 改写成文章风格。
- 再写一段 Prompt 让 AI 生成配图提示词。
- 把提示词复制到 Nanobanana Pro 去生成图片。
- 下载图片,复制文章,去排版。
这一套下来,至少需要一个小时,而且中间任何一步都需要你人工干预。
2. 新模式(Skills 流程)
在我们的课程中,会通过构建一套 Skills 来解决这个问题。
这套流程被拆解为几个独立的 Skill,就像流水线上的机械臂:
- Skill A:
srt-dl(字幕搬运工)- 功能:你给它一个 URL,它自动调用 Python 脚本下载视频字幕文件到本地。
- Skill B:
transcript-to-draft(初稿整理师)- 功能:读取本地字幕文件,根据预设的结构化 Prompt,将其转化为文章初稿。
- Skill C:
draft-to-article(文章润色师)- 功能:读取初稿,根据你提供的“写作风格指南”,对文章进行润色、格式化处理。
- Skill D:
article-illustrator-generator(插画设计师)- 功能:分析文章内容,自动提取关键画面描述,调用绘图模型生成配图。
最后,我们拥有一个总指挥技能:它负责把上面四个 Skill 串联起来。
现在,你的工作流变成了:
给 AI 发一个 YouTube 链接 → 等待 5 分钟 → 收到一篇带配图的完整中文文章。
更酷的是,这些 Skills 也是模块化的。
某天你自己写了一篇文章,想配个图,你不需要走全套流程,只需要单独调用 article-illustrator-generator 这个技能,它立刻就能为这篇文章生成配图。
这就是 Skills 的魅力:模块化、自动化、可复用。
04
渐进式披露优势

在 AI 的使用中,有一个让所有开发者和重度用户头疼的问题:上下文窗口(Context Window)不够用。
不管现在的模型号称支持多大的上下文,如果你每次对话都把几十个工具的说明全部塞进去,不仅会消耗大量的 Token,更致命的是会导致模型“注意力分散”。
模型就像人一样,给它的信息越多,它越容易忽略关键细节,产生“幻觉”。
Agent Skills 巧妙地引入了“渐进式披露”设计理念。
这就好比你去图书馆借书。图书馆有几十万本书(Skills),但你进门的时候,管理员不会把几十万本书都堆在你桌上。
Skills 的加载分为三个阶段:
-
第一阶段:索引
当系统启动时,它只加载所有 Skill 的 名称 和 简短描述。
- AI 此时只知道:哦,我有下载字幕、文章配图、生成PDF这几个技能可以用。
- 消耗 Token:极少。
-
第二阶段:读取手册
当你对 AI 说:帮我处理这个视频链接。 AI 意识到需要用到“下载字幕”这个技能,它才会去加载该 Skill 对应的
SKILL.md文件,阅读具体的操作指南。- 消耗 Token:中等,仅在需要时产生。
-
第三阶段:调用资源
只有当
SKILL.md中明确指出需要运行某个 Python 脚本,或者参考某个具体的 PDF 文档时,系统才会去读取这些“重资产”。- 消耗 Token:精准投放。
这种机制极其高效。
它允许你在你的 AI 助手里挂载成百上千个 Skill,从写代码到查天气,从分析财报到推荐食谱,却几乎不占用初始的上下文空间。
这真正实现了 AI 能力的“按需加载”与“无限扩展”。
05
为什么你需要掌握 Skills?

Skills 并不是程序员的专属玩具,它完美解决了实际应用中的三个核心痛点:
1. 注入领域专业性
通用大模型(如 DeepSeek)知道如何“做数据分析”,但它不知道“你们公司”是如何做数据分析的,它不知道你们的表头定义,也不知道你们的报表格式。
通过 Skills,你可以把公司的程序性知识注入给 AI。
你可以告诉它:“在我们公司,处理数据必须先过滤掉某列为空的行。”
2. 驯服非确定性系统
大模型本质上是一个概率模型,它的输出是非确定性的(每次回答都不太一样)。这在闲聊时是惊喜,在工作中很容易就是灾难。
通过 Skills 中定义的严谨步骤,我们可以强行约束 AI 的行为路径,让这个非确定性的系统,稳定地输出我们需要的确定性结果。
3. 赋予新能力
通过关联本地脚本,Skills 可以让 AI 完成它原本绝对做不到的任务。
大模型本身不能联网下载文件,不能操作你电脑上的 Excel。但 Skills 可以作为桥梁,连接 AI 的大脑和外部世界的 API。
总结来说,Skills 是:低门槛(易用性) + 高天花板(可扩展性)。
打个比方:
你刚买来的手机(Agent)可能只会打电话。
- 你给它装上“高德地图”的
Skills,它就能导航。 - 你给它装上“多邻国”的
Skills,它就能教英语。 - 你不需要自己造手机,你只需要像搭积木一样安装 Skills。
现在的开源社区,已经涌现了大量高质量的 Skills:自动剪辑视频、自动生成 PPT、全网热点抓取… 你只需要拿来用,通过叠加和组合,你的手机就不仅仅是个电话,而是你的超级管家。
06
课程:手把手带你打造 AI 助手

聊了这么多理念,终于要进入正题了。
我知道很多读者看完了上面的内容,心里会想:“说明我都能看懂,但我不会写代码,怎么弄?”
这也是我开设这门 《Agent Skills 实战构建指南》 的初衷。
1. 课程初心
在设计这门课的时候,我不断问自己一个问题:“如果回到三个月前,我希望有一门什么样的课,能带我少走弯路?”
回应这个问题,我希望这门课:
- 门槛足够低:不讲晦涩的底层原理,只讲怎么用。尽可能让所有愿意学的人,无论文科理科,都能快速上手。
- 由浅入深:从最简单的
Hello World开始,既了解标准,又能从零开始创建自己的第一个 Skill。 - 真实、真实、还是真实:拒绝为了演示而演示的玩具案例。所有案例都来自真实的生产环境,会涉及到很多只有在工程实践中才会踩到的坑和积累的经验。
2. 课程大纲(动态调整中)
这是目前的规划内容,但我希望课程是“活”的。
如果在上课过程中发现某个新的技术点对大家更有价值,我们会随时调整内容。
- 模块一:启蒙与标准
- Skills 标准深度解析。
- 环境搭建:让你的电脑准备好迎接 Agent。
- 实战:编写你的第一个技能
Say Hi to Skills。
- 模块二:拿来主义
- 精选第三方优质 Skills 介绍。
- 如何安装和使用别人的技能?
- 如何鉴别一个 Skill 的质量?
- 模块三:实战案例拆解(核心)
- 案例 A:AI 生图工作流,逆向工程,如何提取参考图片提示词,并封装成批量 AI 配图技能。
- 案例 B:自媒体自动化,微信公众号文章从选题到排版的全工作流最佳实践。
- 案例 C:信息源内容自动筛选,AI 资讯精选日报自动抓取、总结与生成工作流。
- 模块四:综合挑战
- 如何借助 Skills 打造个人专属的 AI 助理。
- 如何维护和迭代你的 Skills 库。
课时安排:保底 8 次直播课,每次课 90 分钟。
3. 课程特色
重要提示:严格意义上来说,如果你自己愿意花大量时间去啃官方文档、去 GitHub 翻阅开源项目、去 Twitter 搜集碎片化教程,你是完全可以通过自学掌握这些内容的。因为我也是这么学过来的。
这门课能帮到什么呢?帮你节省时间和积累经验。
我把你可能需要花 3 个月摸索的坑,浓缩在 8 节课里填平。所有示例都来自于我在生产环境的真实应用,这些实战细节也是文档里不会写的。
07
课前准备与要求

很多同学担心工具和环境配置安装,这里做一点说明。
1. 工具和服务
其实不用太担心,预估上课人数不会多到顾不过来,我会尽可能照顾到每一个人的环境配置。
如果有必要,我会额外加一堂课专门讲环境安装。
本次课程主要涉及的工具:
- Opencode(对中文支持友好,工具本身开源免费)
- Trae(国内环境友好)
锦上添花的工具和服务(课程会用到,推荐,但对于跑流程非必须):
- NotebookLM
- Claude Code
- Cursor
- OpenRouter API
2. 关于 AI 模型
对于 AI 大模型选择来说,我一贯建议是:在经济和条件允许的范围内,尽可能使用最好的模型。
模型直接决定了你 Skills 输出质量的上限。当然,纯从学习逻辑的角度,模型不是卡点,国产大模型现在也非常优秀,完全可以跑通流程。
在课程中,我尽可能会多演示不同大模型的输出效果,这样大家有一个直观的感受,对大家去做选择也有一些帮助。
下面是在课程中会演示到的一些大模型:
- Anthropic 的 Opus / Sonnet 4.5
- OpenAI 的 GPT 5.2
- Google 的 Gemini 3 Pro 和 Nanobanan Pro
- DeepSeek 3.2 / Kimi 2.5 / GLM 4.7 / Minimax 2.1
注:原则上,你需要具备基础的解决问题的能力,比如注册账号、下载软件等。遇到问题我会给建议,但无法代劳。
08
费用及报名
- 价格:299 元 / 8 次 / 人,一次课只需要一杯咖啡钱。
- 形式:直播上课 + 录屏回放 + 社群讨论。
- 福利:报名即邀请免费加入我的 AI 学习社群(社群平时单独门槛费为 99 元)。
开课时间
- 先入群,群内通知,年前开课
双重福利:
- 如果你在 2025 年已经付费(99元)加入了我的 AI 学习社群,本课程免费获取。
- 如果你购买了本课程,则自动获得社群会员资格。
退费承诺:
- 开课一次后,如果你觉得“听不懂”、“没价值”或者“不喜欢我的讲解”,无理由全额退费!
- 开课两次后,恕不退款,望理解!
哪怕你在看到这篇文章时,课程已经开始甚至结束了,依然可以直接购买。录屏回放和资料包一样不少,社群大门依然为你敞开。
09
结语

技术发展的速度快得让人眩晕。
以前我们说种一棵树最好的时间是十年前,其次是现在。
在 AI 时代,这句话变成了:掌握一项技能最好的时间是它刚成为标准的时候。
Agent Skills 刚刚起步,现在正是入局的最佳窗口期。希望我们能一起,做第一批“吃螃蟹”并被螃蟹滋养的人。
我们课上见。
