我知道的所有 Agentic Engineering 技巧（2026年 6月）

发表于 2026-06-08 分类于转发

2026年6月，Matt Van Horn 发布新帖《Every Agentic Engineering Hack I Know》，被超60万人观看。本文整理了关于 Agentic Engineering 的22条心得。

原文链接：我知道的所有 Agentic Engineering 技巧（2026年 6月）

我知道的所有 Agentic Engineering 技巧（2026年 6月）

来源：Datawhale
作者：Matt Van Horn

三个月前，Matt Van Horn 的《我知道的所有 Claude Code 技巧》在 X 上爆火。就在刚刚，他发布的新帖《Every Agentic Engineering Hack I Know》也很快被超 60 万人观看。

他是一位连续创业者，今年发布了 last30days（2.7 万星）、Printing Press（4000+ 星），并成为了一些最大开源项目的顶级贡献者：Python、Go、GStack 和 Paperclip。

而这一身经验，他最后都浓缩成了关于 Agentic Engineering 的 22 条心得。

一、先规划，再动手

01｜有想法，先 /ce-plan ，不要直接开干

脑子里冒出一个想法，第一反应：/ce-plan 生成 plan.md。它接什么上下文都行：

GitHub issue 链接直接贴进去；
终端报错，Cmd+Shift+4 截图，Ctrl+V 粘进去；
设计稿、Slack 讨论串、产品脑暴图，也都能喂进去；
如果想法还很模糊，先用 /ce-brainstorm 把问题聊清楚，再进 /ce-plan 。

把模糊想法先外化成一个计划文件，再往下走。

02｜plan.md 是给 agent 看的，自己扫一眼标题就够

原文里直接说：”Plans are for agents, you silly human.”

plan.md 逼 agent 先 research、先承诺方案、写清 acceptance criteria，然后别偷懒，真的把它做完。他还给过一个比喻：”The plan is the leash.” 没计划的 agent 容易抄近路、提前停工；有计划才能按完整交付往下做。

实际操作就是：看一眼标题，直接 /ce-work 。真有不懂的地方，在会话里追问 TLDR?、eli5 this plan，或者”等一下，为什么选这个方案？”

03｜不限于写代码，重度脑力工作也用同一条 loop

/ce-plan 和 /ce-work 用在非工程类工作上同样顺手：

战略文档；
产品 spec；
竞品分析；
board update；
复杂讨论后的整理与提案。

做法是：先别直接写最终文档，先让 agent 规划这件事需要哪些输入、哪些角度、先做什么研究、怎么组织输出。复杂问题先降成可执行的 planning problem。

二、怎么把活高效喂给 agent

04｜语音做主输入

voice-to-LLM 和传统语音转文字不一样：对面是大模型，能靠上下文把你含糊、重说、卡壳的部分补回来。

配置参考：

Mac 上用 Monologue 或 WisPr Flow；
手机上直接用 Apple 自带听写，因为 iOS 来回切 App 太慢；
办公桌上配一个鹅颈麦。

05｜同时开 4 到 6 个 cmux 会话

日常状态：

一个在写 plan；
一个在按另一个 plan build；
一个在跑 last30days 做研究；
一个在修刚测出来的 bug。

一个窗口里的 /ce-plan 在研究时，切到另一个窗口 /ce-work；第二个在执行，又把第三个 bug 塞进去。整个变成多线程调度 agent。

06｜新终端标签页默认直达 Claude Code

一个新 tab 打开后如果还要 cd、手敲 claude，启动 agent session 的成本还是高。做法是把终端默认入口改掉，新 tab 一开就是 Claude Code。Ghostty 下可以通过 launcher 脚本把新窗口的默认命令直接接到 Claude Code。文件夹层级基本可以不依赖了，因为 agent 会自己找项目。

07｜远程控制 + 邮箱入口

在 ~/.claude/settings.json 里加上：

1	"remoteControlAtStartup": true

电脑上开的 session，手机 Claude App 也能接着看、接着控。人在外面排队，家里 Mac 上的任务还在跑，掏手机就能继续接管同一个上下文。

再给 Claude Code 配一个邮箱（用的是 AgentMail），给这个邮箱发邮件就等于给 agent 新开了一个任务入口。

08｜跳过权限确认

同时跑 6 个 agent 会话，不可能一个个去点”允许修改””允许执行命令”。Claude 配置里直接打开：

1 2	defaultMode: bypassPermissions skipDangerousModePermissionPrompt: true

再配上 WebSearch、WebFetch、Bash、Read、Write、Edit 的 allow 列表。原文里他的说法是：”Maybe. I say YOLO. It’s my computer. GitHub is there if I break everything.”

09｜Claude 管 plan，Codex 管 build

三种交接方式：

Codex IDE extension：任务发过去，结果应用回来；
/ce-work –codex：在 Compound Engineering 的 loop 里委托给 Codex；
Printing Press 的 Codex 模式：prompt 结尾加 codex。

参数偏好：

Codex：reasoning xhigh，fast mode on；
Claude Code：reasoning xhigh，fast mode off。

三、agent 强不强，看你喂了多少上下文

10｜ /ce-plan 之前，先跑一遍 /last30days

这是 Matt 自己的开源项目，用法是：先研究，再计划。

例子：在 Vercel 的 agent-browser 和 Playwright 之间做选择，他没先读文档，直接跑：

1	/last30days Vercel agent browser vs Playwright

几分钟内 Reddit、X、YouTube、HN 等平台的讨论被并行抓回来。结果是 agent-browser 每次调用吃掉的上下文更少，而 Playwright 光工具定义就灌进去几千 token。再把这批结果喂给 /ce-plan integrate agent-browser ，做出来的 plan 直接站在社区最近 30 天的真实经验上。

last30days 会并行搜索 Reddit、X、YouTube、TikTok、Instagram、HN、Polymarket、GitHub 和整个 Web。使用时机：选库之前、做 feature 之前、见合伙人之前、写文章之前。

11｜会议别自己总结，原始 transcript 直接扔进去

和候选人吃午饭聊了 90 分钟，有产品、有吃的、有孩子，中间夹着产品想法。Granola 全程录音。结束后不整理，直接把完整 raw transcript 扔进 Claude Code：

1	/ce-plan turn this into a product proposal

不要先”替模型总结一遍”。原始对话里的跑题、停顿、插科打诨，模型会自己判断哪些留下、哪些忽略。原文里他的说法是：Granola 原始记录 + 当前代码库 + 之前所有战略文档一起喂进去，那份 proposal 当晚就能发出。

12｜同时跑多个 agent 时，你负责给信号

原文标题叫 Human Signal：agent 提供产量，人提供品味、方向和 react-and-redirect。要做的是不断给出反馈：

“第二版更接近了，但把第一版的语言拿回来”
“先处理最大的风险”
“这一段太长了”
“这个方向不对，换个角度”

原文原话：agents supply volume, you supply taste.

13｜视频也走同一条 loop

用 HyperFrames：先写 HTML/脚本，再让 agent 渲染成 MP4。

一个项目一个文件夹；
里面一个 script.md；
每一幕、动效、字幕节奏都写清楚；
交给 agent 生成最终 composition 和视频。

做过 Granola CLI demo、Agent Cookie launch video 之类的内容。小技巧：GIF 上传到 catbox，在 GitHub PR、README 和 issue 里渲染都很好。

14｜笔记做成 agent 的知识库

plan 越做越好，是因为 agent 一直能读到过去的计划、会议、留下的判断。

可用的工具：

Bear + Bear CLI：十年笔记、会议、半成型想法、决策记录，可读写；
Obsidian：生态很深；
gbrain：跨机器、跨 agent 同步；
supermemory：agent memory layer。

核心动作：找一个带 CLI 或 API 的笔记系统，让 agent 能读进去。本质是 Personal RAG。

15｜”随时随地工作”背后是一台 Mac mini 和几台远程机器

不是手机上看一眼通知的那种 remote，是把整台工作台带上。

Mosh 抗差网，Wi-Fi 不稳或漫游时比普通 SSH 稳得多；
tmux 抗断线，飞机上断网 20 分钟连回来接着干；
Hermes、OpenClaw 做更自治的远程工作；
Agent Cookie 在主力 Mac 和 Mac mini 之间同步 cookies 和 .env。

从欧洲回程的飞机上就是这么一路把 feature 发完的。

四、让 agent 走出终端，接管真实工作

16｜plan.md 给 agent 看，Proof 给同事看

plan.md 在终端里好用，直接拿给同事看不顺手。把 plan.md 或 spec 丢进 Proof，生成一个链接：

同事像看文档一样看；
可以做 inline comment；
评论能再流回 agent loop。

比把 Markdown 粘到 Slack 里强。

17｜任何做超过两次的事，写成 skill

原文：Anything I do more than twice, I turn into a skill.

不建议从零写 skill。直接对 agent 说：

1	look at the Compound Engineering skill and help me make one like this for [X]

让它先读一个跑通的 skill，再照着 scaffold 你的版本。一次性 workflow 变成 agent 能长期复用的命令。

18｜开源贡献放进同一条 loop

已有数百个 PR 被合并进不同开源项目，做的都是正经功能。涉及的项目包括 Python、Go、OpenCV、Vercel Agent Browser、OpenClaw 等。在一些项目的贡献者榜单里排名靠前：Compound Engineering / Superpowers / Emdash #3，GStack / Paperclip #4，Vercel Agent Browser #6，Camoufox #2。

做法：先找一个自己每天真的在用的工具，发现真实缺口，用 /ce-plan + /ce-work 补掉。

两个社交方面的建议：

去项目的 Discord 里出现，PR 只是进门，关系才是留下来的原因；
在 X 上花 1-3 美元/月订阅你尊重的人。他订阅 @garrytan、@jason、@teknium，给 @garrytan 发带 PR 的帖子时，因为自己是付费订阅者，对方会收到特殊通知。

19｜M5 Max + 64GB RAM 也扛不住

之前两年旧的 laptop 被跑废：6 个 Claude 会话 + Codex 全天挂着。升级到 M5 Max、64GB RAM，还是被打爆。全新机器电池状态下最夸张只撑一个小时。应对：

到处背一个 Anker battery brick；
Tesla 里常备 Anker 车载充电器；
sudo pmset -a disablesleep 1，直接不让机器休眠。

20｜Printing Press：给真实世界服务做一层 CLI

很多服务只在网页里手动点点点，把这些动作包装成 agent 能直接调用的 CLI。这个项目叫 Printing Press，现在是独立项目 @ppressdev。

难点在认证。agent 光知道服务没用，得带着你的登录态去操作。配套组件是 Agent Cookie：把真实浏览器的 session 交给 CLI，让 agent 直接带着登录态行动。

能处理的不只是 GitHub issue 和代码库，还包括生活和工作服务，比如给 Tesla 预热这种。原文的判断是：工作方式会不会变，很大程度取决于能不能把自己每天在用的服务印成 agent 可调用的接口。

五、最后两条提醒

21｜Agent 很容易上瘾

原文这一节标题就叫 AI Psychosis。原话是 agent 没让人少干活，身边几乎所有人都在比过去任何时候更拼命。

他把这套 loop 形容成反馈极快的视频游戏：你说一句，东西就长出来；改一句，结果又更好。原话：”Building with agents is the greatest video game ever made.”

风险不是做出来的东西没人用，而是沉浸在 build 的兴奋里，把身边的人和真正重要的关系弄丢了。建议：休息，出门，和爱的人说话，做一点真的有人想要的东西——哪怕那个”人”只有你自己。

22｜这篇文章本身就是这么写出来的

一个 Markdown 文件：

Claude Code 跑在 cmux 里；
对着 Monologue 用语音说：”把 no-IDE 的开头再进化一下””让 don’t-read-the-plan 那一节更 spicy 一点””把 Tesla 和 Instacart 那个故事加进去”；
agent 负责改写，他负责反应；
last30days 提供最近材料；
Proof给别人 review。

最后补了一句：这次甚至没用 Zed，已经不用 IDE 了，也不敲代码。只剩下：Talk, plan, build。

地点不限：桌前、沙发上、车里、足球场边。

写在最后：看完这 22 条，先记住 5 件事

第一，Agentic Engineering 把 research → plan → build → review 变成了默认流水线。

第二，拉开差距的往往是上下文。截图、issue、Slack 讨论、原始会议录音、过去十年的笔记，这些东西能稳定流进 agent，效果会完全不一样。

第三，人的位置在上移。做的越来越像调度：给信号、给判断、给品味、给取舍。

第四，agent 一旦拿到远程控制、邮箱入口、登录态和真实服务接口，就从代码助手变成执行层。

第五，越能 build，越要小心 build 带来的成瘾感。

这 22 条拆成了可照着做的动作：该怎么开头、该开什么窗口、该把什么上下文喂进去、该在哪一步让人接管、以及什么时候该停下来。

原文地址：https://x.com/mvanhorn/status/2061877533885473181