用 AI 工作的几条经验

协作 AI 进入团队几个月，最直接的体感是：工具能力的上限，远高于实际产出的提升幅度。原因不在 AI，在我们用它的方式。

下面几条是这段时间踩出来的经验，分享给团队。

提需求是一项独立技能

AI 实现的速度变快之后，瓶颈就从”敲代码”挪到了”想清楚”。一个含糊的需求跑三轮试错的时间，比花十分钟把需求写清楚要长得多。

每次开新对话之前，先用几行写明白：要做什么、输入输出是什么、约束是什么、怎么算完成。这一步看着笨，但稳。灵感型 prompt 是消耗品，跑一次就废；写清楚的需求是资产，能沉淀进 skill 反复用。

不是所有事都适合让 AI 全自动。我大概按三层来分。

最底下是重复活：commit 信息、版本号、changelog、模板代码这种。没什么判断空间，交给 skill 跑就行，越自动越好。

往上一层是工程判断——架构选型、命名、抽象边界。这一层让 AI 列几个选项加利弊是合适的，但选哪个得人来定。能讲清为什么选这个，本来就是工程师的本职。

最上面一层，是和业务、用户、产品场景强相关的判断。这一类不要交给 AI 主导。AI 只能基于你给的信息拟合，对真实场景没有体感——它不知道某个客户上次抱怨过什么，也不知道下个季度方向会变。

最大的隐患就是把这一层交出去。判断外包久了，能力会萎缩，而且自己感觉不到。

实际工作流里，一个 session 通常扮演协调者：通过 skill 把任务分发给不同 agent，每个 agent 在自己干净的上下文里干活。这套架构的稳定性，取决于两件事。

一是 skill 的设计质量。skill 是协议层，写糙了下面所有 agent 都会歪。一个好 skill 应该把”做什么、输入是什么、输出是什么、怎么算完”写死，agent 拿到能直接跑，不需要回主 session 来回问。skill 越像一份接口契约，整个流水线越稳。

二是主 session 自己的克制。协调者一旦开始下场写代码，整个架构就破了——你既要协调又要实现，注意力分裂，agent 也用不好。主 session 该不该写代码，是一条很容易越过、但越过就有代价的边界。

“AI 让我效率提升了 X 倍”这种话基本没意义，除非有数据。

最简单的办法是在任务记录里加三列：AI 估时、实际时长、不用 AI 估时。一个月后回头看，真正提效的任务往往不是你以为的那些。很多时候 AI 反而更慢——因为人在反复修需求。

.claude/ 下的 rules、skills、agents 是会膨胀的。每次踩坑都想加一条规则，半年后规则比代码还多，新人接入成本会高得吓人。

每条规则要标清来源：哪个项目、哪个场景、是不是通用。定期 review，把过期的删掉。配置膨胀是 AI 时代特有的技术债，比代码债更隐蔽。

最大的隐患不是 AI 不够强，是把工具当目的、把方法论当成果。

AI 协作走到现在，比”能不能用”更重要的，是”知道什么时候不用”。