知行合一,以 AI 炼器
记录 AI 实践、技术思考与生活点滴
知行合一,以 AI 炼器
记录 AI 实践、技术思考与生活点滴

系列:用经典理论指导 Agent 实践(第一篇) TL;DR: 设计审查的 agent 既要找得全又要找得准,一个 agent 难以两全。借鉴信息检索 15 年前的级联检索思路,拆成两个 agent——一个只管找全(Recall Pass),一个只管找准(Precision Pass)。设计方案的缺陷更早暴露,开发阶段返工的风险降低了。 ...

今日实践 选一个你手头真实的多步骤任务,和 AI 对话 至少 15 轮(一问一答算一轮)。 任务举例: “帮我规划一次家庭旅行(目的地、行程、预算、行李清单)” “帮我从零搭建一个个人博客(选平台、定主题、写第一篇文章)” “帮我分析一个职业选择(现状梳理、利弊分析、行动计划)” 不要刻意控制对话方向——让它自然展开。对话到第 10 轮左右时,停下来发这条消息: ...

系列:破而后立的 TDD 流程迭代(第三篇) 第一篇:失之东隅,收之桑榆的实验 · 第二篇:以尺度尺,用方法改进方法 TL;DR: 阶段六已经在集成层做诊断——逐个 bug 追问根因。它不做的事是跨缺陷的模式扫描、组件缝隙检查、执行顺序分析。这些事归阶段七。小系统里阶段七多拦几个 bug;系统大了,同样是这三件事,产出变成建测试基础设施、硬化 CI 规则、驱动架构演进。阶段七不做架构决策,但它提供架构决策最稀缺的输入——基于证据的问题定位。 ...

📖 本文是「AI 之路初阶升级指南」系列的第 3 篇(共 5 篇)。 第一篇:理解你手里的工具 · 第二篇:从模糊提问到精确指令 · 第三篇:把 AI 变成协作伙伴 · 第四篇:建立个人体系(即将发布) · 第五篇:毕业考核与下一步(即将发布) ...

系列:破而后立的 TDD 流程迭代(第二篇) 上一篇:失之东隅,收之桑榆的实验 TL;DR: TDD Pipeline 自己教的是"给原则不给步骤",但自己却长成了步骤驱动的工具。把阶段一到阶段五的操作步骤删掉,只保留原则、风险提示和反面例子。模型自己推导出了被删掉的步骤,输出质量不降。原因:阶段一到阶段五是创作阶段,需要发散空间,去掉固定轨道反而更好。同样的策略用在阶段六上失败了——下一篇讲为什么。 ...

技巧卡:格式约束速查 花 10 秒在 Prompt 里指定格式,省下 10 分钟的二次整理。 以下是 6 种最常用的格式约束,每种附一句可以直接用的 Prompt 模板。 1. Markdown 表格 适合:需要对比、汇总的结构化信息。 ...

系列:破而后立的 TDD 流程迭代(第一篇) TL;DR: 把 TDD Pipeline 的阶段六(预发布测试)从"步骤驱动"精炼为"原则驱动",预设目标没达到——精炼版在单个 bug 的追问深度、证据链完整度上都比原版差。但对比两组输出发现了维度差异:精炼版在组件缝隙检查、跨 bug 模式扫描上比原版强。这些差异指向一个判断——阶段六不需要被精炼,而是缺了一个阶段六没有定义的任务,后来被定义为阶段七。 ...

技巧卡:什么时候该让 AI「一步步思考」? 在 Prompt 末尾加一句"请一步步推理"——这就是 Chain-of-Thought(CoT)。简单到不像话,但在合适的场景下效果惊人。 ...

RBGO(角色-背景-目标-输出)框架上一篇已经讲过。但知道框架和会用框架之间,隔着一道坎:怎么把"我想要……“翻译成四要素? ...

TL;DR: 展示 Why Articulation 模板升级前后的对比,以及三条可迁移建议:给原则不给示例、关键步骤用强制语气、相信模型的自我组织能力。实验局限也已说明。 前两篇回顾 第一篇从 Anthropic 的对齐研究出发:教模型"为什么"比只教它"正确答案",误对齐率从 22% 降到 3%(约 7 倍),而且用 1/28 的数据量就能达到同等效果[1]。我把这个发现移植到 prompt 设计里,造出了 Why Articulation 模板——要求 AI 动手前先说清目的、风险和方案。 ...