核心概念
🧩 Agent 架构模式
- Orchestrator / Subagent 分层
- ReAct(推理-行动-观察)循环
- Plan-and-Execute 规划模式
- Multi-Agent 并行执行
- 工具调用链与错误恢复
💾 记忆与状态管理
- In-context vs External Memory
- 跨会话记忆持久化
- 结构化知识图谱
- 错误学习与反思机制(如 GEAR)
- 会话 Kick-off / Wrap-up 模式
🔒 可靠性设计
- 信任边界与权限分级(L0-L3)
- Human-in-the-loop 触发条件设计
- Fallback 降级策略
- 幂等性与状态恢复
- 可观测性(日志 / Trace)
🔌 协议与集成
- MCP(Model Context Protocol)
- A2A(Agent-to-Agent)协议
- OpenAPI 工具注入
- Sandbox 隔离执行环境
工具栈
LangGraph
CrewAI
AutoGen
OpenAI Agents SDK
Smolagents
MCP Servers
A2A Protocol
Weights & Biases
Langfuse
Claude Code Skills
建立的使用习惯
🏗
系统图先于代码 —— 画出数据流、Agent 边界、人工干预节点,再开始实现
📊
持续评估(Evals) —— 像测试代码一样测试 prompt,建立回归测试集
🔄
错误库与反思循环 —— 系统性收集 Agent 失败案例,周期性更新系统 prompt
📖
跟踪学术与工程前沿 —— 每周阅读 arXiv、跟进 Anthropic / OpenAI 工程 blog
升级到 L4 的关键跃迁
→
从构建工具到贡献知识
在某个领域形成独到见解,开始对外分享(技术博客、开源项目、论文/RFC)。AI 工具链的认知框架已经内化,更关注模式的通用性和边界条件。推荐行动:把你解决的一个非平凡问题写成文章或开源项目,逼自己梳理清楚背后的思维模型。