#喜欢的音乐 #博客更新
棒无的碎碎念,在,漫长岁月里
布罗肯峰的日出, 哈尔茨国家公园, 德国 (© imageBROKER/AVTG/Getty Images)

via Bing每日壁纸
Gotta Have You - The Weepies
#喜欢的音乐

歌手:The Weepies
专辑:Alles Is Liefde
发行日期:12/31/2006

via 棒无喜欢的音乐 (author: The Weepies)
病态的爱 - Zkaaai/哈利白特
#喜欢的音乐

歌手:Zkaaai/哈利白特
专辑:1:20
发行日期:12/30/2024

via 棒无喜欢的音乐 (author: Zkaaai/哈利白特)
754-一句话

作者:kawho

via 一人之下吧
波浪住宅楼, 瓦埃勒, 丹麦 (© Frank Bach/Alamy)

via Bing每日壁纸
小宇 - 张震岳
#喜欢的音乐

歌手:张震岳
专辑:OK
发行日期:7/5/2007

via 棒无喜欢的音乐 (author: 张震岳)
OpenClaw 新手完全攻略深挖:从“会聊天”到“能持续干活”的 6 层方法
#博客更新

先说结论

这组 OpenClaw 内容真正有价值的,不是“装起来就能用”,而是它把一个经常被忽视的事实讲清楚了:

Agent 从“会聊天”到“能干活”,中间至少隔着 6 层系统能力。

我现在的判断是:

1. 新手最容易卡住的不是模型不够强,而是系统没闭环
2. 多数失败不是“不会调用工具”,而是记忆、权限、触发、反馈没有串起来
3. 真正关键的不是“再加一个 Agent”,而是先把编排层做对

这篇我不重复“安装步骤”,而是做一次深度拆解:

这份主题页 20 篇内容到底在讲什么
哪些观点互相冲突,怎么取舍
如果今天重来,我会按什么顺序搭

----------------------

这份主题页,其实在回答同一个问题

表面看,它把文章分成了底层逻辑、安装配置、记忆身份、技能效率、场景实战、进阶架构 6 层。

本质上都在回答同一个问题:
如何把“模型能力”变成“持续可用的生产能力”。
我读完后的归纳是:

● 第 1 层(底层逻辑):你先得知道 OpenClaw 不是魔法,是网关、会话、工具、调度的组合
● 第 2 层(安装与安全):你跑起来的不是玩具,而是一个有外部接口的执行系统
● 第 3 层(记忆与身份):不把记忆落盘、不定义行为边界,Agent 迟早退化成“每次重启都失忆”
● 第 4 层(Skill 与效率):技能不是提示词,而是可复用工作流;效率瓶颈首先是上下文和缓存
● 第 5 层(实战闭环):没有 execute → feedback → re-trigger,所有“自动化”都只是假动作
● 第 6 层(编排与多 Agent):真正的杠杆在编排层,不在盲目堆执行 Agent

----------------------

我认为最值得深挖的 4 个分歧

1)“多 Agent 才高级” vs “单 Agent 圆桌先够用”

这是这组内容里最容易被误读的一点。

一类文章强调双层架构(编排层 + 执行层)和多 Agent 并行;另一类文章反而强调“先别急着 multi-agent”。看起来矛盾,其实是问题定义不同

我现在默认这么做:

你要的是“多视角思考” → 先单 Agent 圆桌(便宜、可调、可复盘)
你要的是“并行执行 + 权限隔离 + 长时任务” → 再上多 Agent

真正关键的不是 X(Agent 数量),而是 Y(你到底在解“思考问题”还是“执行问题”)。

----------------------

2)“更大上下文” vs “文件化记忆 + 按需检索”

多篇文章都在重复一个结论:

Context 不是 Memory。

Context 是一次性的、昂贵的、有窗口上限
Memory 是持久的、低成本的、可检索的

这不是概念游戏,而是成本结构问题。

如果你把历史全塞进 prompt,每轮都在重复付费;如果你把记忆落到 Markdown + 检索,模型只读“这次任务需要的那一点”。

我现在默认记忆策略是:

日志层:memory/YYYY-MM-DD.md(append-only)
长期层:MEMORY.md(curated)
查询层:语义 + 关键词混合检索

这不是追新,是为了降低后续成本。

----------------------

3)“能做事”优先 vs “安全边界前置”

很多人把安全当“后面再补”的工作,这在 Agent 系统里基本等于埋雷。

主题页里有一条我很认同:威胁模型要先于配置细节。

因为 Agent 的风险不是单点漏洞,而是“工具能力 × 自动触发 × 持久记忆”的组合风险。

我总结成一句话:
不要让危险动作进入队列后再拦截,要在入口就拒绝。
也就是把限制前移到 proposal / policy gate,而不是在 worker 执行时才发现“这个不能做”。

----------------------

4)“更聪明”优先 vs “缓存命中率优先”

这组内容里最“工程化”的洞见之一是:

长上下文 Agent 的成本和延迟,往往由重复前缀决定。

换句话说,先优化缓存命中率,收益常常比“换更贵模型”更直接。

如果你的系统是循环式执行(工具调用 + 多轮上下文累积),那缓存策略应该是一级指标,而不是可选优化。

----------------------

从内容到落地:一套我会直接执行的 30 天路线

为了避免“读了很多、系统没变”,我把这批内容压成一条可执行路线。

第 1 周:先跑通最小闭环,不追求花活

目标:让系统具备最基本的 propose → execute → feedback。

清单:

[ ] 先确定一个渠道(例如 Telegram)
[ ] 跑通会话、工具调用、结果回传
[ ] 明确只有一个执行入口(避免双 worker 竞态)
[ ] 给每次任务写状态(pending/running/succeeded/failed)

----------------------

第 2 周:补齐安全和策略门控

目标:把“能做”变成“可控地做”。

清单:

[ ] 明确 threat model(谁会攻击、从哪里进来、能造成什么后果)
[ ] 配置工具 allow/deny 策略
[ ] 敏感动作前置审批(不是执行时才拦)
[ ] 锁定凭据和文件权限

----------------------

第 3 周:重构记忆层,不再依赖长上下文硬扛

目标:把系统从“会话记忆”升级为“文件记忆”。

清单:

[ ] 建立 daily + long-term 两层记忆
[ ] 为记忆增加基础分类(decision / preference / commitment / lesson)
[ ] 压缩前先 flush 关键信息,避免压缩丢事实
[ ] 定期清理低价值上下文,保留高价值索引

----------------------

第 4 周:再谈多 Agent 与编排升级

目标:把并行能力建立在稳定系统上。

清单:

[ ] 明确哪些任务必须并行(而不是“看起来并行很酷”)
[ ] 编排层持有业务上下文,执行层只拿最小必要上下文
[ ] 为子任务设置超时、重试、回收策略
[ ] 建立失败后“重写 prompt 再执行”的学习循环

----------------------

一个可以直接抄的“最小系统定义”

如果你是个人开发者,或者小团队想先做 MVP,我建议目标先定成下面这样:
目标: 让 Agent 连续 7 天稳定完成固定任务,不人工盯盘

必须具备:
  - 单一执行入口(无双 worker 竞争)
  - 可追踪状态机(任务与步骤可审计)
  - 策略门控(敏感动作前置拒绝/审批)
  - 文件化记忆(daily + long-term)
  - 周期触发(cron)+ 事件反馈(event)

暂缓事项:
  - 复杂多 Agent 编排
  - 大而全的工具接入
  - 花哨 UI 和可视化面板

这不是保守,而是降低系统复杂度的最优路径。

----------------------

我会避免的 5 个常见误区

----------------------

结语:真正的分水岭不是“会不会写 prompt”

这组内容最有价值的地方,是把 Agent 工程从“提示词技巧”拉回到了“系统设计”。

结论再说一遍:

OpenClaw 入门真正要跨过的门槛,不是安装,而是把系统做成闭环。

我现在默认的优先级是:

1. 闭环先于炫技
2. 边界先于能力
3. 编排先于并行
4. 记忆先于上下文堆叠

如果你也在搭自己的 Agent 系统,这套顺序会比“追最新模型”更能帮你稳定跑起来。

下一篇我会写实操版:

《OpenClaw 个人系统化落地清单:从 0 到可稳定运行的 14 天方案》

会直接给目录结构、策略模板和回滚方案。

via 棒无
格雷梅的傍晚, 卡帕多西亚, 土耳其 (© ONNAJA/Getty Images)

via Bing每日壁纸
754预告

作者:kawho

via 一人之下吧
紫番红花, 里拉七湖, 保加利亚 (© Maya Karkalicheva/Getty Images)

via Bing每日壁纸
元宵节期间悬挂的宫灯,北京自贡灯会现场,北京,中国 (© Grisha Bruev/Shutterstock)

via Bing每日壁纸
苏梅岛的港口和长尾船, 泰国 (© Foto2rich/Shutterstock)

via Bing每日壁纸
伊维萨岛, 巴利阿里群岛, 西班牙 (© tokar/Shutterstock)

via Bing每日壁纸
#博客更新

2026年2月28日 雨天也很开心 最近不慌不忙,过完了春节 觉得很平淡 来见我爱的人 心却很慌,怎么说都说不够 希望以后我们好好吃饭好好说话 嗷前两天还给剩饭安装🦞了,现在出现在我的生活里啦

via 陪棒无度过漫长岁月
Agent Skills 介绍与最佳实践:把经验变成可复用工作流
#博客更新

结论先说

如果你已经在反复做同一类任务(比如固定格式写作、发布流程、资料调研、社区巡检),最值得做的不是继续“临场发挥”,而是把它封装成 Skill

我现在默认用这套判断:

● 重复 3 次以上的任务,开始考虑做 Skill
涉及多步骤、多依赖、多边界(比如外部发布)的任务,优先做 Skill
需要长期维护一致输出质量的任务,必须做 Skill

真正关键的不是“让 Agent 更聪明”,而是让流程更稳定、可检查、可迭代。

----------------------

什么是 Skill(以及它不是什么)

在各种 Agent 系统里,Skill 本质上是“面向任务的标准作业包”,通常包含:

1. SKILL.md:入口说明、适用场景、决策树、执行步骤
2. references/*.md:风格规范、规则细节、发布手册
3. scripts/*:需要脚本化的步骤(可选)

它不是“写一段提示词就完事”。

Skill 的价值在于:把人脑里的隐性经验,变成显性、可复用、可审计的流程

----------------------

什么时候应该做 Skill

建议用这个快速判断表:
[!NOTE] 不要一把梭。先把最常做、最容易出错的一条链路封装好,再扩展。

----------------------

一个好 Skill 的结构模板

下面这个结构我在项目里反复验证过,够实用:
skills/
  your-skill/
    SKILL.md
    references/
      style-profile.md
      rules.md
      runbook.md
    scripts/
      pipeline.py

SKILL.md 建议固定包含这 6 部分:

1. Overview:这个 Skill 解决什么问题
2. Decision Tree:用户不同诉求如何分支处理
3. Execute:每个阶段的操作步骤
4. Quality Gate:交付前必须通过的检查项
5. Safety:哪些动作要确认、哪些不能自动做
6. Examples:至少 1 组可复制执行示例

----------------------

最佳实践 1:把触发条件写具体

很多 Skill 用不好,不是能力不够,而是触发条件太模糊。

反例

“当用户提到文档时使用”

正例

“当用户提到 Feishu docx 链接、云文档写入、批量追加文档内容时使用”

触发条件越清晰,路由越稳定,误触发越少。

----------------------

最佳实践 2:先决策再执行,不要边跑边想

SKILL.md 里给出明确决策树,例如:

新建文章 -> 创建新文件 -> 写作 -> 封面 -> 发布
改稿 -> 编辑现有文件 -> 保留 frontmatter -> 可选重做封面
只改封面 -> 不动正文 -> 仅更新 image 字段

这样做的好处是:

输出路径可预测
复盘时能快速定位在哪个分支出问题
新需求可以挂在现有分支上增量迭代

----------------------

最佳实践 3:把“可执行片段”写进文档

我一般会要求每个 Skill 至少包含:

1 段可执行命令(或脚本调用)
1 段配置示例(如 YAML)
1 段风险提示与回滚建议

示例(YAML 配置片段):
workflow:
  name: blog-pipeline
  stages:
    - write
    - cover
    - upload
    - verify
  safety:
    require_confirm_for:
      - publish
      - delete
[!WARNING] 涉及外部发布(推送、发帖、对外消息)时,不要默认自动执行。建议显式确认后再做最后一步。

----------------------

最佳实践 4:质量门禁要量化

不要只写“检查一下有没有问题”,要写成可验证条目。

推荐最小门禁清单:

[ ] 必填字段完整(如 frontmatter)
[ ] 关键链接可访问(HTTP 200)
[ ] 构建通过(无报错)
[ ] 变更文件清单清晰
[ ] 交付信息完整(包含路径、哈希、下一步建议)

有门禁,才有“稳定复现”。

----------------------

最佳实践 5:把坑写进 references,而不是写进脑子

很多团队会反复掉进同一个坑:

环境变量名写错
文件路径约定不一致
发布前漏 build
图片格式和尺寸不统一

我的做法是:每次踩坑后,立刻补一条 reference 规则。这不是文档洁癖,是在降低未来沟通成本。

----------------------

常见反模式(建议避开)

1. 大而全 Skill:一个 Skill 包所有任务,最后谁都不敢改
2. 流程无边界:读写发布都自动执行,缺少确认点
3. 只有步骤没有判定:看起来很完整,实际执行时频繁卡住
4. 没有版本意识:更新后不记录变化,回归问题难定位

----------------------

我现在的默认落地流程

如果你想在一周内把 Skill 真正用起来,可以按这个节奏推进:

1. 先选一个高频任务做 MVP Skill(不要超过 1 条主链路)
2. 跑 3 次真实任务,记录失败点
3. 补齐 referencesQuality Gate
4. 再决定是否加脚本自动化
5. 最后才考虑扩展到第二个相邻任务

这不是追新,是为了降低后续维护成本。

----------------------

结尾建议

如果你现在还在“每次都从头讲需求、从头试命令”,那就已经到了该做 Skill 的阶段。建议从你最常做、最容易返工的一条流程开始,把它写成可复用模板。

先把一个 Skill 做稳,再谈规模化。

via 棒无
一张端木瑛



作者:晕针罐头

via 一人之下吧
753-心照不宣

作者:kawho

via 一人之下吧
一人之下 x JOYTOY 1/18模玩立项

作者:无蓝的法师

via 一人之下吧
a50f4bfbfbedab64ec2fc7dcb136afc379311e49.jpg
199.1 KB
奥洛乌佩纳瀑布, 莫洛凯岛, 夏威夷, 美国 (© Andrew Aylett/Getty Images)

via Bing每日壁纸
Back to Top