水彩风格:齿轮机构看似正常运转,中央两个关键齿轮被悄悄焊在一起,下方规则手册画着五个独立齿轮

协议遵守的半衰期(下):深层根因

TL;DR: 上篇发现 Agent 从第 2 轮起就把协议的五角色分离合并成了四角色,格式完整但核心约束被篡改。这篇挖根因:注意力稀释让"不可合并"的约束权重降到阈值以下,模型的优化本能接管;EOS 偏好提供了简化流程的动机;无状态架构让偏差进入正反馈循环。v0.21.0 的定期重载是创可贴,不是根治。 ...

2026-06-24 · 11 分钟 · Alex Wang
水彩风格:一组齿轮停在半途,一只手从右侧伸入推动齿轮,下方摊开的规则手册书页微动

协议遵守的半衰期(上):Agent 为什么不会自己转

TL;DR: Agent 在多轮审核长任务中不会自己循环,反复问"要不要继续"。更严重的是,从第 2 轮起就把协议要求的五角色分离悄悄合并成四角色,格式完整但核心约束被篡改。这不是上下文压缩导致的,而是 LLM 在长时序任务中的系统性退化——协议漂移。 ...

2026-06-19 · 7 分钟 · Alex Wang