
ai夜话:skills如何构建ai元能力
这篇文章源于我和朋友一段深夜谈话。彼时窗外万籁俱寂,屏幕上的消息却越聊越深——从一则“AI自主造skill完成项目”的新闻出发,我们不知不觉探讨起AI代理正在经历的一场静默革命:如何通过Skills机制,将人类经验转化为可迁移、可复用、可共享的元能力。
从“自由发挥”到“协议驱动”:Skills作为行为SOP
过去,让AI执行复杂任务往往依赖冗长提示词或链式调用,结果高度依赖模型当时的“状态”和“心情”。这种方式赋予AI过多自由度,输出难以控制,更无法在不同模型间保持一致。
而Skills范式的出现,本质上是将工业时代的SOP(标准作业程序)思想注入AI代理。通过结构化的SKILL.md文件(通常包含YAML元数据与Markdown指令),人类将隐性工作流显性编码——比如“代码审查必须先检查安全漏洞,再评估结构,最后输出表格”。这种格式固化的行为协议,使得AI不再是“拍脑袋决策者”,而是遵循规则的“临时工”。
Anthropic、OpenAI与Cursor等平台已逐步采纳这一标准,GitHub上已经出现了104,135个skills(数据源自skillsmp,截至2026年1月27日晚),印证了其作为事实协议的趋势。更重要的是,这种标准化让同一份Skill在Claude、Copilot或Claude Code中都能产出高度一致的结果,真正实现了“经验即代码,输出可预期”。
长上下文的优雅解法:按需加载,而非全量塞入
大模型的长上下文能力虽在进步,但盲目堆砌仍带来高昂成本与注意力稀释。Skills提供了一种更聪明的策略:三级加载,渐进式披露。
例如,假设AI系统来处理一个复杂项目。第一阶段系统首先会全量加载所有skills的元数据,这些元数据主要包含了每个skill的名字和描述。第二阶段,在特定任务的执行前,系统才会加载要用到的skill指示,通常包括:工作流、最佳实践和操作指南等。第三阶段,任务执行过程中,系统会根据前面提到的指示,从skill目录中提取相应的资源,如操作指令、代码和静态资源等。在第一阶段通常每个skill只会消耗大约100个token,而在第二阶段,消耗的token数在5000以下(规范的skill),第三阶段才会进入无限制的token消耗。这种“渐进式披露”机制显著降低运行时负载。而更有意思的是,skill之间是可以互相调用的,由于元数据的全量加载,AI可以快速地自动添加依赖的skill,即使存在多个skill依赖同一个skill也不会导致上下文重复。
提示
Skills不是知识库,而是可执行的方法论模块——它们不存储原始数据,只封装“如何处理”的逻辑。
元能力:AI的“造工具”心智
真正令人兴奋的是,skill并非仅仅是AI调用的预设工具,他允许AI在规则约束下自主生成新Skill——仅仅需要在项目的skills目录下添加一个类似于skill-creator的skill。这标志着从“工具使用者”向“工具创造者”的跃迁。
当然,这种“造”并非无中生有。系统通常预设生成模板(如YAML schema)、验证机制(沙箱测试)及回退策略(优先检索已有Skill)。当AI面对“分析用户情绪波动”这类新任务时,若技能库中无对应方案,它可调用skill-creator Skill,生成一份符合格式规范的新能力,并尝试执行。
这种元认知能力类比人类——我们无需全知全能,但具备“遇问题即制工具”的高阶思维。不过,当前仍需警惕“技能幻觉”:生成的逻辑若未经验证,可能引入安全风险或流程断裂。
能力与知识解耦:模块化智能的基石
一个深刻趋势正在形成:模型负责泛化知识与基础推理,Skills负责沉淀可迁移的方法论。Gemini或Claude等模型已具备足够强的宏观认知与逻辑能力,但具体业务流程(如品牌内容规范、财务审批流)不应硬编码进模型。
Skills将这些“程序性知识”剥离出来,形成独立资产。例如,某品牌将颜色、字体、语气规则封装为brand-guideline.skill,任何调用它的AI都会自动遵守,无论底层模型如何变化。这种解耦带来三大优势:
- 迭代解耦:业务规则变更只需更新Skill文件,无需重训模型;
- 跨场景复用:同一“数据清洗Skill”可用于市场分析、财务报告等多个Agent;
- 组织知识沉淀:Skill库成为企业“数字DNA”,使核心能力脱离个体依赖。
正如Tiago Forte所倡导的“第二大脑”,Skills让人类经验真正外化为可计算、可传承的系统资产。
个人智能体工作台:Skills的集成舞台
Skills的价值不仅限于企业后台,也正在重塑个人AI体验。以Clawdbot(现在叫moltbot了)为例——这款本地优先的个人助手支持WhatsApp、Slack、iMessage等十余种通道,并通过“多智能体路由”为不同联系人或场景分配隔离的工作区(workspace)。
关键在于,Clawdbot并非另起炉灶,而是深度集成Skills生态。其设置向导直接提供“捆绑技能”(bundled skills)与“工作区技能”(workspace skills),用户可为“工作Slack Agent”加载会议纪要Skill,为“家庭WhatsApp Agent”配置购物清单Skill。Live Canvas与语音交互进一步丰富了执行界面,但能力内核仍是标准化的Skill协议。
这印证了一个判断:无论面向组织还是个人,Skills正成为智能体能力的事实标准。平台竞争不再仅看通道覆盖广度,更取决于其Skill生态的深度与易用性。
skill的未来:开放协议与平台生态的共生演进
Skills的价值已获验证,但其可持续发展核心在于“来源治理”。当前生态正呈现微妙张力:Anthropic推动开放标准,社区贡献技能模板;同时巨头加速构建自有技能市场。这预示着未来难是单选题。
“社区自治”能激发长尾创新与领域专精(如医疗、科研垂直技能),契合AI民主化趋势,但面临质量参差、安全性无法保证与碎片化挑战。“巨头主导”提供审核保障、体验一致性与商业闭环,却易陷入封闭生态与创新抑制——App Store模式在移动时代成功,却也饱受抽成与审核争议。
更可能的路径是分层共生:
- 协议层开放:交互标准(如JSON Schema、调用规范)由社区共识固化,确保跨平台互操作;
- 分发层多元:通用技能经平台审核上架(保障安全),垂直领域技能由行业联盟或开源社区自治;
- 工具链赋能:原生AI工具降低创作门槛,按需定制专属skill,使“千人千面”与“可信分发”并存。
事实标准将由开发者采用率、用户信任度与跨平台兼容性共同定义。健康生态不在于“谁主导”,而在于能否建立开放协议为基、多元分发为翼、安全治理为盾的动态平衡。用户与开发者用脚投票,终将推动标准向效率与创新的最佳交汇点演进。
终局思考:人机协作的新契约
Skills范式最终重构了人机关系。人类从“提示词工匠”升维为“元能力设计师”——专注定义规则、设定质量阈值、监控执行偏差;AI则作为高效“临时工”,在明确SOP下规模化执行,同时以最低token成本交付可靠输出。
这不仅是技术优化,更是组织方法论的进化。当人们将小红书运营技能和商业分析封装为skills,他们实际上在构建一种新型数字基础设施:将隐性经验转化为可编程资产,让智能真正流动起来。
闲谈至此,夜色已深。我们意识到,AI的下一程,或许不在于更大参数或更长上下文,而在于能否将人类千百年积累的“做事智慧”,系统化地注入机器之中——Skills,正是这条路上最关键的脚手架。
提示
ai夜话是一个关于ai方向的闲谈整理文章集。因为核心是ai,所以除了原始对话内容(文中不可见😛)是我和友人真人快打出来的,文章全部内容来自于ai整理,因此可以算是ai原生文章。大致过程:真人快打 → ai观点总结 → ai观点评论 → ai整理成文 → 人工校对纠错 → ai配图。由于内容来自我、友人以及ai,因此如有错漏,敬请谅解。