从 Prompt 到 Skills

2026-03-20 pv

1. 背景

翻了一下,上次写 AI 相关的文章,还是在去年十二月份。

短短三个月过去,AI 的世界依旧热闹,异彩纷呈。比较出圈的,是一款叫作 OpenClaw 的现象级产品。

它其实就是对一系列 AI 能力的封装。火的原因,我认为有两点:

  • 交互简单。直接通过日常通信工具交流,入口唯一,使用门槛低,而且主流 App,像 QQ、钉钉和飞书等都支持。
  • 效果够好。一方面固然源于大语言模型的不断进化,另一方面,也跟一系列 AI 底层工具链的逐渐完善有关,像 MCP、Skills 等。

LLM 发展初期,围绕“对话”展开,直接与 LLM 交流,强调 Prompt

中期开始聚焦“任务”,于是需要结合 LLM 构建一整套能力编排框架

Prompt 工程的文章,2023🔗 年的时候写过,那时候 ChatGPT 才刚刚爆火。

短短两三年过去,之前文章中提到的几点原则,像给出清晰指令、迭代开发等,依旧适用。

不仅如此,更多能力和工具被开发出来,AI 所能处理问题的疆域不断扩大。

今天就打算结合 LLM 和 Prompt,拓展到两个常用的工具:MCP 和 Skills。

2. LLM 和 Prompt

LLM(Large Language Model)是整个 AI 工具的核心。

其核心原理是:

一个基于概率模型,不断生成下一个 Token 的函数。

十分擅长:

  • 自然语言理解和生成
  • 推理
  • 代码生成

也有弱点:

  • 幻觉
  • 无状态
  • 输出结果不稳定
  • 无法直接操作外部世界(文件、浏览器等)

LLM 相当于一个人的大脑

Prompt 则是与这个大脑对话的唯一入口。

一个好的 Prompt 应该包含四部分:

  • 定义角色和行为
  • 清楚地给定上下文
  • 具体的任务
  • 输出的要求(如,格式、风格等)

Prompt 的问题是:

  • 自然语言天然的模糊属性,导致需求描述不够清晰
  • 对于复杂问题,描述困难,易引发混乱
  • 同样无法直接操作外部世界

Prompt 相当于人的语言系统

3. MCP 和 Skills

LLM 和 Prompt,都留了一个巨大的问题没有解决。

语言空间是一个虚拟空间(Cyber Space),与真实的物理空间存在一个巨大的鸿沟。

MCP (Model Context Protocol),在这两者间,架了一道桥。

它是由 Anthropic 推动的一项开放标准,简单理解就是:

一种让 LLM 能“结构化调用外部能力”的协议层。

有了 MCP 这样一个中间层,LLM 被赋予了诸如文件读写、浏览器操控、邮件发送等无限能力。

举一个简单的例子,获取天气的 MCP。

先注册到 LLM 工具集合中:

{
"tools": [
{
"name": "get_weather",
"description": "...",
"parameters": {...}
}
]
}
  1. LLM 在理解自然语言的过程中,例如:告诉我今天的天气
  2. 选择将该任务分发给该 MCP
  3. 按照它事先给定的格式填充参数,执行一次 MCP 调用
  4. 等待返回结果,继续后续任务

MCP 实现了:

  • 将”自然语言“翻译成”结构化执行“的结果,准确,稳定
  • 至此,LLM 拥有了操纵真实世界的能力

MCP 像是人的手和脚

Skills 是一个更新的概念,同样由 Anthropic 提出。

按照官方的说法:

Skills are folders of instructions, scripts, and resources that Claude loads dynamically to improve performance on specialized tasks.

(技能是包含指令、脚本和资源的文件夹,Claude 会动态加载这些文件夹来提高特定任务的性能。)

如果说 MCP 是对某个特定“能力”的封装,那么 Skills 便是对某个特定“任务”解决方案的结构化组织

Skills 是一组动作,用来完成给定任务,因此我理解:

Skills = LLM + Workflow + MCP

就像是开车,车在那里(MCP),你需要先用钥匙启动,然后踩离合,挂挡,松离合,踩油门,车才能开起来(Skills)。

因此,Skills 名字起的很好,就是人的技能

4. 分层架构

说完这些,一个层次分明的模型呼之欲出。

┌──────────────┐
│ User/Agent │
└──────┬───────┘
┌──────────────┐
│ Prompt │
└──────┬───────┘
┌──────────────┐
│ LLM │
└──────┬───────┘
┌────────────────────┐
│ Skills │
│ (Workflow Layer) │
└──────┬─────────────┘
┌────────────────────┐
│ MCP │
│ (Tool Invocation) │
└──────┬─────────────┘
┌────────────────────┐
│ External World │
│ API / DB / Browser │
└────────────────────┘

与网络模型一样,分层,通常是拆分并解决一个复杂问题的好办法

5. 总结

看起来,AI 发展的过程,就是越来越像一个人的过程。

伴随着一系列工具和任务编排系统的发展演进,AI 攻城拔寨,能做的事情越来越多。

OpenClaw 带给人的震撼,就是个很好的例子。

没有什么是突然发生的,不过是量变引起的质变罢了。

在 AI 技术日新月异的大背景下,作为一个软件工程师,一方面受益于它的提质增效,另一方面也有危机感:事情 AI 都能做了,自己的价值在哪里?

(完)

参考

  1. OpenClaw — Personal AI Assistant🔗
  2. 模型上下文协议 - 维基百科,自由的百科全书🔗
  3. What is the Model Context Protocol (MCP)? - Model Context Protocol🔗
  4. GitHub - anthropics/skills: Public repository for Agent Skills · GitHub🔗
在 GitHub 上编辑本页面

最后更新于: 2026-03-20T02:03:59+08:00