components
组件
横向:把 agent 拆成可独立讨论的组件,逐个看各框架如何实现。
组件维度 · Components
横向视角:把 agent 拆成可独立讨论的组件。每篇组件笔记回答两个问题——这个组件是什么 / 解决什么问题,以及它在各框架里有哪些不同实现方式(纵向汇总)。
控制与推理
- reasoning-loop — 推理/执行循环(agent 的”主循环”)
- planning — 规划与任务分解
- context-engineering — 上下文工程与 prompt 管理
能力与外部世界
- tool-use — 工具调用 / function calling
- memory — 记忆(短期 / 长期 / 向量)
- model-abstraction — 模型抽象层(LLM provider 接口)
- skills-plugins — 技能 / 插件 / 扩展机制
协作与编排
- multi-agent-orchestration — 多智能体编排(角色 / 通信 / handoff)
- state-persistence — 状态与持久化
工程化
- observability-eval — 可观测、追踪与评估
- runtime-execution — 运行时、执行环境与部署
- human-in-the-loop-governance — 人在环与治理
关联
- 总体框架见 component-taxonomy;横向对比见 component-matrix
全部 · 12
多智能体编排
多个各有角色的 agent 如何协作:角色定义、拓扑(主从/网状/流水线/群聊)、通信(handoff/消息/共享状态)。把一个超级 agent 拆成一个团队。概念详见 single-vs-multi-agent。
工具调用
agent 与外部世界交互的手段:定义工具(名字+参数 schema+实现)→ 把工具暴露给模型 → 模型产出调用 → 框架解析并执行 → 结果回灌。是把 LLM 从"会说"变成"会做"的关键组件。MCP 正在成为工具的标准协议。
规划与任务分解
把一个大目标拆成可执行的子步骤/子任务,并在执行中按需重规划。从"无显式规划的 ReAct"到"先产出完整任务 DAG 再执行",是 agent 处理复杂、多步、需分工任务的关键。
记忆
让 agent "记住"超出当前上下文窗口的信息:短期(会话内)、长期(跨会话)、以及基于向量检索的语义记忆。记忆的核心三动作是写入、检索、遗忘。
技能与插件
把能力打包成可复用、可分发、可热插拔的单元(skill / plugin / extension),让 agent 的能力像装 App 一样扩展。介于裸工具和完整 agent 之间的封装粒度。
可观测与评估
看见 agent 内部发生了什么(tracing、日志、token/成本),并衡量它做得好不好(eval)。Agent 行为不确定,可观测与评估是把它从 demo 推向生产的必备工程能力。
模型抽象层
用统一接口屏蔽不同 LLM provider(OpenAI / Anthropic / 本地模型 / 国产模型…)的差异:聊天、流式、函数调用、多模态、token 计数。让上层 agent 逻辑与具体模型解耦、可切换。
人在环与治理
在 agent 自主行动的关键节点插入人的审批/干预,并施加策略约束与审计:审批门、权限/策略 enforcement、签名审计轨迹。是把自主 agent 安全投入生产的刹车与方向盘。
上下文工程
在有限的上下文窗口里,把"对的信息"以"对的形式"放进去:系统 prompt、工具说明、历史消息的裁剪/压缩、记忆与检索结果的注入。Agent 质量很大程度上取决于上下文工程,而非模型本身。
推理循环
agent 的"主循环":反复执行"模型决策 → 执行动作 → 观察结果 → 更新状态",直到完成或停止。它是承载 范式(ReAct / plan-execute / graph…)的执行骨架,也是其他所有组件的挂载点。
运行时与执行
agent 在哪里、以何种形态运行:代码执行沙箱、并发模型、部署形态(库 / 服务 / serverless / 桌面 / GitHub Actions)。尤其当 agent 会执行模型生成的代码时,安全沙箱是刚需。
状态与持久化
agent 的状态如何表示、保存与恢复:消息历史、变量、计划进度、子 agent 状态。持久化让 agent 能断点续跑、容错、长时间运行,以及支持人在环的暂停-审批-继续。