components

组件

横向:把 agent 拆成可独立讨论的组件,逐个看各框架如何实现。

组件协作12 个组件按层次协作——治理在顶、底座在下,核心推理调用能力、依赖模型。点击任意组件查看它在各框架的实现。
治理总览 · 约束
协作多 agent 编排
控制核心决定下一步
能力与外部世界交互
模型决策引擎

组件维度 · Components

横向视角:把 agent 拆成可独立讨论的组件。每篇组件笔记回答两个问题——这个组件是什么 / 解决什么问题,以及它在各框架里有哪些不同实现方式(纵向汇总)。

控制与推理

能力与外部世界

协作与编排

工程化

关联

全部 · 12

多智能体编排

多个各有角色的 agent 如何协作:角色定义、拓扑(主从/网状/流水线/群聊)、通信(handoff/消息/共享状态)。把一个超级 agent 拆成一个团队。概念详见 single-vs-multi-agent。

工具调用

agent 与外部世界交互的手段:定义工具(名字+参数 schema+实现)→ 把工具暴露给模型 → 模型产出调用 → 框架解析并执行 → 结果回灌。是把 LLM 从"会说"变成"会做"的关键组件。MCP 正在成为工具的标准协议。

规划与任务分解

把一个大目标拆成可执行的子步骤/子任务,并在执行中按需重规划。从"无显式规划的 ReAct"到"先产出完整任务 DAG 再执行",是 agent 处理复杂、多步、需分工任务的关键。

记忆

让 agent "记住"超出当前上下文窗口的信息:短期(会话内)、长期(跨会话)、以及基于向量检索的语义记忆。记忆的核心三动作是写入、检索、遗忘

技能与插件

把能力打包成可复用、可分发、可热插拔的单元(skill / plugin / extension),让 agent 的能力像装 App 一样扩展。介于裸工具和完整 agent 之间的封装粒度。

可观测与评估

看见 agent 内部发生了什么(tracing、日志、token/成本),并衡量它做得好不好(eval)。Agent 行为不确定,可观测与评估是把它从 demo 推向生产的必备工程能力。

模型抽象层

用统一接口屏蔽不同 LLM provider(OpenAI / Anthropic / 本地模型 / 国产模型…)的差异:聊天、流式、函数调用、多模态、token 计数。让上层 agent 逻辑与具体模型解耦、可切换。

人在环与治理

在 agent 自主行动的关键节点插入人的审批/干预,并施加策略约束与审计:审批门、权限/策略 enforcement、签名审计轨迹。是把自主 agent 安全投入生产的刹车与方向盘。

上下文工程

在有限的上下文窗口里,把"对的信息"以"对的形式"放进去:系统 prompt、工具说明、历史消息的裁剪/压缩、记忆与检索结果的注入。Agent 质量很大程度上取决于上下文工程,而非模型本身。

推理循环

agent 的"主循环":反复执行"模型决策 → 执行动作 → 观察结果 → 更新状态",直到完成或停止。它是承载 范式(ReAct / plan-execute / graph…)的执行骨架,也是其他所有组件的挂载点。

运行时与执行

agent 在哪里、以何种形态运行:代码执行沙箱、并发模型、部署形态(库 / 服务 / serverless / 桌面 / GitHub Actions)。尤其当 agent 会执行模型生成的代码时,安全沙箱是刚需。

状态与持久化

agent 的状态如何表示、保存与恢复:消息历史、变量、计划进度、子 agent 状态。持久化让 agent 能断点续跑、容错、长时间运行,以及支持人在环的暂停-审批-继续。