ai夜话：skills如何构建ai元能力

Ivis Tang2026/1/28大约 9 分钟

这篇文章源于我和朋友一段深夜谈话。彼时窗外万籁俱寂，屏幕上的消息却越聊越深——从一则“AI自主造skill完成项目”的新闻出发，我们不知不觉探讨起AI代理正在经历的一场静默革命：如何通过Skills机制，将人类经验转化为可迁移、可复用、可共享的元能力。

从“自由发挥”到“协议驱动”：Skills作为行为SOP

过去，让AI执行复杂任务往往依赖冗长提示词或链式调用，结果高度依赖模型当时的“状态”和“心情”。这种方式赋予AI过多自由度，输出难以控制，更无法在不同模型间保持一致。

而Skills范式的出现，本质上是将工业时代的SOP（标准作业程序）思想注入AI代理。通过结构化的SKILL.md文件（通常包含YAML元数据与Markdown指令），人类将隐性工作流显性编码——比如“代码审查必须先检查安全漏洞，再评估结构，最后输出表格”。这种格式固化的行为协议，使得AI不再是“拍脑袋决策者”，而是遵循规则的“临时工”。

Anthropic、OpenAI与Cursor等平台已逐步采纳这一标准，GitHub上已经出现了104,135个skills（数据源自skillsmp，截至2026年1月27日晚），印证了其作为事实协议的趋势。更重要的是，这种标准化让同一份Skill在Claude、Copilot或Claude Code中都能产出高度一致的结果，真正实现了“经验即代码，输出可预期”。

长上下文的优雅解法：按需加载，而非全量塞入

大模型的长上下文能力虽在进步，但盲目堆砌仍带来高昂成本与注意力稀释。Skills提供了一种更聪明的策略：三级加载，渐进式披露。

例如，假设AI系统来处理一个复杂项目。第一阶段系统首先会全量加载所有skills的元数据，这些元数据主要包含了每个skill的名字和描述。第二阶段，在特定任务的执行前，系统才会加载要用到的skill指示，通常包括：工作流、最佳实践和操作指南等。第三阶段，任务执行过程中，系统会根据前面提到的指示，从skill目录中提取相应的资源，如操作指令、代码和静态资源等。在第一阶段通常每个skill只会消耗大约100个token，而在第二阶段，消耗的token数在5000以下（规范的skill），第三阶段才会进入无限制的token消耗。这种“渐进式披露”机制显著降低运行时负载。而更有意思的是，skill之间是可以互相调用的，由于元数据的全量加载，AI可以快速地自动添加依赖的skill，即使存在多个skill依赖同一个skill也不会导致上下文重复。

提示

Skills不是知识库，而是可执行的方法论模块——它们不存储原始数据，只封装“如何处理”的逻辑。

元能力：AI的“造工具”心智

真正令人兴奋的是，skill并非仅仅是AI调用的预设工具，他允许AI在规则约束下自主生成新Skill——仅仅需要在项目的skills目录下添加一个类似于skill-creator的skill。这标志着从“工具使用者”向“工具创造者”的跃迁。

当然，这种“造”并非无中生有。系统通常预设生成模板（如YAML schema）、验证机制（沙箱测试）及回退策略（优先检索已有Skill）。当AI面对“分析用户情绪波动”这类新任务时，若技能库中无对应方案，它可调用skill-creator Skill，生成一份符合格式规范的新能力，并尝试执行。

这种元认知能力类比人类——我们无需全知全能，但具备“遇问题即制工具”的高阶思维。不过，当前仍需警惕“技能幻觉”：生成的逻辑若未经验证，可能引入安全风险或流程断裂。

能力与知识解耦：模块化智能的基石

一个深刻趋势正在形成：模型负责泛化知识与基础推理，Skills负责沉淀可迁移的方法论。Gemini或Claude等模型已具备足够强的宏观认知与逻辑能力，但具体业务流程（如品牌内容规范、财务审批流）不应硬编码进模型。

Skills将这些“程序性知识”剥离出来，形成独立资产。例如，某品牌将颜色、字体、语气规则封装为brand-guideline.skill，任何调用它的AI都会自动遵守，无论底层模型如何变化。这种解耦带来三大优势：

迭代解耦：业务规则变更只需更新Skill文件，无需重训模型；
跨场景复用：同一“数据清洗Skill”可用于市场分析、财务报告等多个Agent；
组织知识沉淀：Skill库成为企业“数字DNA”，使核心能力脱离个体依赖。

正如Tiago Forte所倡导的“第二大脑”，Skills让人类经验真正外化为可计算、可传承的系统资产。

个人智能体工作台：Skills的集成舞台

Skills的价值不仅限于企业后台，也正在重塑个人AI体验。以Clawdbot（现在叫moltbot了）为例——这款本地优先的个人助手支持WhatsApp、Slack、iMessage等十余种通道，并通过“多智能体路由”为不同联系人或场景分配隔离的工作区（workspace）。

关键在于，Clawdbot并非另起炉灶，而是深度集成Skills生态。其设置向导直接提供“捆绑技能”（bundled skills）与“工作区技能”（workspace skills），用户可为“工作Slack Agent”加载会议纪要Skill，为“家庭WhatsApp Agent”配置购物清单Skill。Live Canvas与语音交互进一步丰富了执行界面，但能力内核仍是标准化的Skill协议。

这印证了一个判断：无论面向组织还是个人，Skills正成为智能体能力的事实标准。平台竞争不再仅看通道覆盖广度，更取决于其Skill生态的深度与易用性。

skill的未来：开放协议与平台生态的共生演进

Skills的价值已获验证，但其可持续发展核心在于“来源治理”。当前生态正呈现微妙张力：Anthropic推动开放标准，社区贡献技能模板；同时巨头加速构建自有技能市场。这预示着未来难是单选题。

“社区自治”能激发长尾创新与领域专精（如医疗、科研垂直技能），契合AI民主化趋势，但面临质量参差、安全性无法保证与碎片化挑战。“巨头主导”提供审核保障、体验一致性与商业闭环，却易陷入封闭生态与创新抑制——App Store模式在移动时代成功，却也饱受抽成与审核争议。

更可能的路径是分层共生：

协议层开放：交互标准（如JSON Schema、调用规范）由社区共识固化，确保跨平台互操作；
分发层多元：通用技能经平台审核上架（保障安全），垂直领域技能由行业联盟或开源社区自治；
工具链赋能：原生AI工具降低创作门槛，按需定制专属skill，使“千人千面”与“可信分发”并存。

事实标准将由开发者采用率、用户信任度与跨平台兼容性共同定义。健康生态不在于“谁主导”，而在于能否建立开放协议为基、多元分发为翼、安全治理为盾的动态平衡。用户与开发者用脚投票，终将推动标准向效率与创新的最佳交汇点演进。

终局思考：人机协作的新契约

Skills范式最终重构了人机关系。人类从“提示词工匠”升维为“元能力设计师”——专注定义规则、设定质量阈值、监控执行偏差；AI则作为高效“临时工”，在明确SOP下规模化执行，同时以最低token成本交付可靠输出。

这不仅是技术优化，更是组织方法论的进化。当人们将小红书运营技能和商业分析封装为skills，他们实际上在构建一种新型数字基础设施：将隐性经验转化为可编程资产，让智能真正流动起来。

闲谈至此，夜色已深。我们意识到，AI的下一程，或许不在于更大参数或更长上下文，而在于能否将人类千百年积累的“做事智慧”，系统化地注入机器之中——Skills，正是这条路上最关键的脚手架。

提示

ai夜话是一个关于ai方向的闲谈整理文章集。因为核心是ai，所以除了原始对话内容（文中不可见😛）是我和友人真人快打出来的，文章全部内容来自于ai整理，因此可以算是ai原生文章。大致过程：真人快打 → ai观点总结 → ai观点评论 → ai整理成文 → 人工校对纠错 → ai配图。由于内容来自我、友人以及ai，因此如有错漏，敬请谅解。