npm - @linnlabs/linnkit - Versions diffs - 0.8.0 - Mend

@linnlabs/linnkit 0.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (123) hide show

package/CHANGELOG.md +84 -0
package/LICENSE +21 -0
package/README.md +178 -0
package/README.zh-CN.md +182 -0
package/dist/agent-invocation-BHcNfrBV.d.cts +30 -0
package/dist/agent-invocation-BznDaXDs.d.ts +30 -0
package/dist/agentEvents-DEB7Fy_J.d.cts +81 -0
package/dist/agentEvents-DEB7Fy_J.d.ts +81 -0
package/dist/agentSpec-EkmviZjy.d.cts +2621 -0
package/dist/agentSpec-EkmviZjy.d.ts +2621 -0
package/dist/ai-engine.types-BpeU_XQG.d.cts +158 -0
package/dist/ai-engine.types-vZRnQcJa.d.ts +158 -0
package/dist/audit-BaRUGaqv.d.cts +307 -0
package/dist/audit-BaRUGaqv.d.ts +307 -0
package/dist/audit-CtcfART1.d.ts +33 -0
package/dist/audit-LeOrm2hX.d.cts +33 -0
package/dist/checkpointMarker-DAI3wUQu.d.cts +8 -0
package/dist/checkpointMarker-DAI3wUQu.d.ts +8 -0
package/dist/cli.cjs +8028 -0
package/dist/cli.cjs.map +1 -0
package/dist/cli.d.cts +4 -0
package/dist/cli.d.ts +4 -0
package/dist/cli.js +8025 -0
package/dist/cli.js.map +1 -0
package/dist/context-manager.cjs +8704 -0
package/dist/context-manager.cjs.map +1 -0
package/dist/context-manager.d.cts +2190 -0
package/dist/context-manager.d.ts +2190 -0
package/dist/context-manager.js +8650 -0
package/dist/context-manager.js.map +1 -0
package/dist/context-trace-DRi5M4lX.d.ts +239 -0
package/dist/context-trace-HE2qY5Q-.d.cts +239 -0
package/dist/contracts.cjs +1333 -0
package/dist/contracts.cjs.map +1 -0
package/dist/contracts.d.cts +8 -0
package/dist/contracts.d.ts +8 -0
package/dist/contracts.js +1214 -0
package/dist/contracts.js.map +1 -0
package/dist/defaultGraphExecutor-BBswR8wn.d.ts +624 -0
package/dist/defaultGraphExecutor-BIjJj7WF.d.cts +624 -0
package/dist/execution-CAIypb41.d.cts +129 -0
package/dist/execution-CAIypb41.d.ts +129 -0
package/dist/index-CHqwkvGp.d.ts +149 -0
package/dist/index-CJeWHopy.d.ts +584 -0
package/dist/index-Cm-JbzTH.d.cts +1450 -0
package/dist/index-Cvr23YCl.d.cts +23 -0
package/dist/index-DDzuSb0n.d.ts +23 -0
package/dist/index-DO4dQgf2.d.cts +584 -0
package/dist/index-DRBWi1fy.d.ts +1450 -0
package/dist/index-Dl5PLgAv.d.cts +149 -0
package/dist/index.cjs +9577 -0
package/dist/index.cjs.map +1 -0
package/dist/index.d.cts +89 -0
package/dist/index.d.ts +89 -0
package/dist/index.js +9563 -0
package/dist/index.js.map +1 -0
package/dist/messages-XthmnHZ3.d.cts +8007 -0
package/dist/messages-XthmnHZ3.d.ts +8007 -0
package/dist/ports-DaatKJXp.d.cts +90 -0
package/dist/ports-DnLuKfpE.d.ts +90 -0
package/dist/ports.cjs +4 -0
package/dist/ports.cjs.map +1 -0
package/dist/ports.d.cts +7 -0
package/dist/ports.d.ts +7 -0
package/dist/ports.js +3 -0
package/dist/ports.js.map +1 -0
package/dist/quickstart.cjs +7697 -0
package/dist/quickstart.cjs.map +1 -0
package/dist/quickstart.d.cts +24 -0
package/dist/quickstart.d.ts +24 -0
package/dist/quickstart.js +7691 -0
package/dist/quickstart.js.map +1 -0
package/dist/runAgent-CPj_9e58.d.ts +88 -0
package/dist/runAgent-HYKlXbVr.d.cts +88 -0
package/dist/runHandle-CyXvzgzk.d.ts +239 -0
package/dist/runHandle-D3gPsD7B.d.cts +239 -0
package/dist/runtime-kernel/events.cjs +1485 -0
package/dist/runtime-kernel/events.cjs.map +1 -0
package/dist/runtime-kernel/events.d.cts +8 -0
package/dist/runtime-kernel/events.d.ts +8 -0
package/dist/runtime-kernel/events.js +1475 -0
package/dist/runtime-kernel/events.js.map +1 -0
package/dist/runtime-kernel.cjs +8656 -0
package/dist/runtime-kernel.cjs.map +1 -0
package/dist/runtime-kernel.d.cts +19 -0
package/dist/runtime-kernel.d.ts +19 -0
package/dist/runtime-kernel.js +8568 -0
package/dist/runtime-kernel.js.map +1 -0
package/dist/sse-vPyrOPa0.d.cts +1687 -0
package/dist/sse-vPyrOPa0.d.ts +1687 -0
package/dist/testkit.cjs +10613 -0
package/dist/testkit.cjs.map +1 -0
package/dist/testkit.d.cts +284 -0
package/dist/testkit.d.ts +284 -0
package/dist/testkit.js +10593 -0
package/dist/testkit.js.map +1 -0
package/dist/todo-B1PmDlp3.d.cts +2253 -0
package/dist/todo-B1PmDlp3.d.ts +2253 -0
package/dist/tokenizer-DFL4I7-I.d.ts +28 -0
package/dist/tokenizer-DH_JXv-H.d.cts +28 -0
package/dist/toolContracts-Blll0241.d.ts +463 -0
package/dist/toolContracts-CLkQmhTG.d.cts +463 -0
package/docs/README.md +76 -0
package/docs/integration/01-installation.md +94 -0
package/docs/integration/02-quickstart.md +104 -0
package/docs/integration/README.md +223 -0
package/docs/integration/agent-registration-guide.md +330 -0
package/docs/integration/audit.md +64 -0
package/docs/integration/child-runs.md +87 -0
package/docs/integration/constraints-and-pitfalls.md +87 -0
package/docs/integration/context-engineering.md +650 -0
package/docs/integration/context-fences.md +289 -0
package/docs/integration/glossary.md +69 -0
package/docs/integration/llm-provider.md +76 -0
package/docs/integration/persistence.md +44 -0
package/docs/integration/realtime.md +76 -0
package/docs/integration/run-supervisor.md +69 -0
package/docs/integration/telemetry.md +48 -0
package/docs/integration/testing.md +95 -0
package/docs/integration/tool-development-guide.md +362 -0
package/docs/integration/tool-history.md +202 -0
package/docs/integration/tools.md +188 -0
package/package.json +115 -0

package/docs/integration/context-engineering.md ADDED Viewed

@@ -0,0 +1,650 @@
+# Context Engineering · linnkit 的上下文工程总览
+> **What** · 所有作用在 messages 上的机制总览 —— `contextPolicy` 12 大分组 + `ContextTrace` 可观测闭环 + `TokenizerPort` + 摘要 / 围栏 / 工具历史压缩。
+> **When to read** · 想精确控制每个 token；上下文超长被裁；要诊断"为什么这条消息被丢了"；自定义 tokenizer；做 token 预算选型。
+> **Prerequisites** · [`agent-registration-guide.md`](./agent-registration-guide.md) ⭐（先理解 `AgentSpec.contextPolicy` 字段结构）。
+> **Key exports** · `ContextTrace` from `@linnlabs/linnkit/contracts` · `TokenizerPort` from `@linnlabs/linnkit/ports` · `formatAgentLlmMessages` / `createMessageFormatter` from `@linnlabs/linnkit/context-manager`。
+> **Related** · [`context-fences.md`](./context-fences.md) ⭐ · [`tool-history.md`](./tool-history.md) · [`agent-registration-guide.md`](./agent-registration-guide.md) ⭐
+> linnkit 的宗旨：**让上下文工程变成精细化、可自由配置、可观测、可审计的事**。
+>
+> 本文是一份**全机制速查表**：列出 linnkit 当前所有作用在"发给 LLM 的 messages"上的机制，**说人话**讲清楚它在做什么、什么时候触发、在哪里改它、当前可以配到什么粒度。
+>
+> 想看 fence 一等接入面的具体落地骨架，跳到 [`context-fences.md`](./context-fences.md)。
+---
+## 0. 一张总览图（一轮请求里发生了什么）
+```text
+host 发出 invoke request
+  │
+  ▼
+[A] AgentMessageOrchestrator 装配
+    ├─ contextPolicy.mustKeep（哪些消息绝不能被裁）
+    ├─ FenceRegistry（host 注册了哪些围栏家族）
+    └─ Preprocessor pipeline 按 request 重建
+  │
+  ▼
+[B] Preprocessor Pipeline（按优先级跑）
+    1. ToolHistoryCompressorPreprocessor   ─ 工具历史压缩
+    2. ToolReplayProtocolGuardPreprocessor ─ 工具回放协议守卫
+    3. HistoryPurificationPreprocessor     ─ 历史净化（清孤儿 / 同 ID 去重）
+    4. FenceLifetimePreprocessor           ─ 剥离旧轮 turn-only fence
+  │
+  ▼
+[C] ContextProvider 三阶段填充
+    1. AgentCoreContextProvider          ─ 不可裁的核心层（system / user）
+    2. AgentWorkingMemoryProvider        ─ 工作记忆按 P1-P4 优先级填到预算上限
+    3. CheckpointSummarizationProvider   ─ checkpoint 前的旧轮裁干净
+    4. (自动触发) SummarizationProvider   ─ 超预算时整段历史摘要
+  │
+  ▼
+[D] applySystemReminderStage 注入
+    根据 stepCount / phase / 工具调用次数等触发规则
+    在最后一条 message 末尾追加 <system-reminder>...</system-reminder>
+  │
+  ▼
+[E] formatAgentLlmMessages 出关
+    根据 fence formatter / 物理 role 把所有 AiMessage 翻译成 LLM wire messages
+  │
+  ▼
+LLM provider
+```
+每个阶段都有独立的配置面。
+---
+## 1. 消息的三大角色与物理位置
+linnkit 的内部消息（`AiMessage` union）最终都会按 LLM 协议的三个 role 出关：
+| Role | 这里有什么 |
+|------|-----------|
+| `system` | `system_prompt`、`placement: 'after-system'` 的 fence（不常变化的固定上下文），例如长期记忆、项目元信息、用户偏好等 |
+| `assistant` | LLM 自己产的 `final_answer` / `thought`（reasoning_content）/ `tool_calls`；以及配对的 `tool_output`（在物理 wire 上挂 `tool` role） |
+| `user` | 用户的 `user_input`、`placement: 'before-current-user'` / `'after-current-user'` 的 fence（经常变化的高频上下文）、例如用户上传的文件、当前时间等以及触发后的 `<system-reminder>` 注入 |
+**重要不变量**：`tool_calls` 和 `tool_output` **必须成对出现**——任何一边丢了另一边就废了。这条不变量贯穿所有压缩 / 裁剪机制。
+---
+## 2. Fence 围栏家族（高度可配置 ✅）
+把任何"想塞给 LLM 的额外上下文"声明成一个家族（kind），告诉 linnkit"放哪、活多久、是否必保留、最多占多少预算"，linnkit 帮你按规则塞进 messages、按生命周期清掉。
+**配置位置**：host 启动时调 `createFenceRegistry(descriptors)`，每条 `FenceDescriptor` 包含：
+| 字段 | 含义 | 取值 |
+|------|------|------|
+| `kind` | 围栏家族名 | host 自定义 kebab-case |
+| `llmRole` | 物理挂到哪个 role | `'system'` / `'user'` |
+| `placement` | 物理位置 | `'after-system'` / `'before-current-user'` / `'after-current-user'` / `'after-last-tool-result'` |
+| `lifetime` | 活多久 | `'turn-only'`（只本轮）/ `'persisted'`（进 history） |
+| `mustKeep` | 是否在 working memory 抽稀时必保留 | `boolean` |
+| `maxBudgetFraction` | 单类 fence 最多占总预算多少 | `(0, 1]` |
+| `formatter` | 怎么把内容包装成 LLM 看到的字面 | host 提供函数 |
+**开放状态**：完全开放。详细装配骨架见 [`context-fences.md`](./context-fences.md)。
+---
+## 3. MustKeepPolicy（通过 `contextPolicy.mustKeep` 配置 ✅）
+声明"哪些消息**永远不能**被工作记忆抽稀机制裁掉"——比如 `system_prompt`、最新的 `user_input`、某类 fence kind。
+**配置位置**：优先写在 `AgentSpec.contextPolicy.mustKeep`。host 也可以提供 fallback policy，作为所有 agent 的默认值。
+```ts
+contextPolicy: {
+  profileId: 'agent',
+  mustKeep: {
+    alwaysKeepTypes: ['system_prompt', 'user_input'],   // 按 AiMessage.type
+    alwaysKeepFenceKinds: ['system-event'],              // 按 fence kind
+    truncationRules: [
+      // 想限量截断（不丢但只保留预算的 X%）
+      { fenceKind: 'memory-context', maxBudgetFraction: 0.2, strategyName: 'memory-truncate' },
+    ],
+  },
+}
+```
+**默认值**：`DEFAULT_MUST_KEEP_POLICY` 已经把 `system_prompt` / `user_input` 等核心 type 列进 alwaysKeepTypes。
+**开放状态**：`AgentSpec.contextPolicy.mustKeep` 已完成运行时接线。host 可以提供 fallback policy，单个 agent 可以通过 spec 覆盖；例如 `additional-context` 这类产品语义应属于 host fallback，不写进 linnkit framework。
+---
+## 4. Preprocessor Pipeline（4 个内置预处理器）
+这一层在"消息进 ContextProvider 之前"跑。按 priority 顺序执行；任何一个抛 fatal `ContextProviderError` 都会中断 pipeline。
+### 4.1 ToolHistoryCompressorPreprocessor —— 工具历史压缩（AgentSpec 高度可配置 ✅）
+把旧的 `tool_calls` + `tool_output` 配对压缩成简短 assistant 文本，控制工具历史不无限膨胀。三种策略：`'per-run'`（默认，按 user_input 边界保留最近 K 个 run）/ `'per-pair'`（保留最近 N 个工具对）/ `'none'`（不压缩）。安全阀：`maxInteractionGroups` 硬上限 + `overflowStrategy`（`'keep-latest'` / `'fail-fast'`）。
+完整字段、默认值与选型对比见 [`tool-history.md`](./tool-history.md) ⭐。
+### 4.2 ToolReplayProtocolGuardPreprocessor —— 工具回放协议守卫（无需配置，自动开启）
+避免旧的工具组被 provider 误认为是结构化 replay。host 装配时已自动启用，不需要管。
+**配置位置**：无；如果你完全自定义 pipeline 才需要手动 register。
+**开放状态**：默认开启；属于协议级保护，没设计成可配置项。
+### 4.3 HistoryPurificationPreprocessor —— 历史净化（无需配置）
+清理孤儿 `tool_calls`（没有对应 `tool_output`）、同 ID 重复消息、空消息等异常状态。
+**开放状态**：默认开启，无配置；这是数据卫生层。
+### 4.4 FenceLifetimePreprocessor —— 旧轮 turn-only 剥离（自动跟 FenceRegistry 走）
+上一轮注入的 `lifetime: 'turn-only'` 的 fence（比如临时引用文本、临时记忆片段），这一轮自动剥掉。
+**配置位置**：注册 fence 时通过 `lifetime` 字段控制；不需要单独配 preprocessor。
+---
+## 5. ContextProvider 三阶段填充
+### 5.1 AgentCoreContextProvider —— 核心层（无需配置）
+把 must-keep 的核心消息（system_prompt + 最新 user_input + alwaysKeep 的 fence）按物理 role 钉到 messages 数组里，**永不裁剪**。
+**开放状态**：行为完全由 MustKeepPolicy 决定（见 §3）。
+### 5.2 AgentWorkingMemoryProvider —— 工作记忆按 P1-P4 优先级填充（AgentSpec 已运行时接线 ✅）
+扣掉核心层之后剩多少预算，按 4 个优先级倒着塞进消息：
+| 优先级 | 内容 |
+|--------|------|
+| **P1** | 最近的工具交互对（tool_calls + tool_output） |
+| **P2** | 纯文本对话（final_answer + user 消息） |
+| **P3** | 更早的工具交互（可能已被 ToolHistoryCompressor 压成 assistant 文本） |
+| **P4** | 循环填充剩余空间 |
+**可配置字段**（写在 `AgentSpec.contextPolicy`）：
+| 字段 | 默认 | 含义 | 开放状态 |
+|------|------|------|---------|
+| `budget.maxTokens` | `120000` | 总预算上限 | ✅ AgentSpec + runtime |
+| `budget.reservedForResponse` | `2400` | 留给 LLM 输出的 token | ✅ AgentSpec + runtime |
+| `budget.workingMemoryBudgetPercentage` | `0.70` | 工作记忆占可用预算的比例 | ✅ AgentSpec + runtime |
+| `reasoningRetention.keepLatestThoughts` | `1` | 最近保留多少条 thought | ✅ AgentSpec + runtime |
+| `workingMemory.minToolInteractionsToKeep` | `2` | 即便预算不够也至少保留多少组工具对 | ✅ AgentSpec + runtime |
+| `workingMemory.maxRecentToolInteractions` | `2` | 原始 tool_calls 形态保留的最大组数 | ✅ AgentSpec + runtime |
+| `workingMemory.toolPairingSearchRange` | `10` | 搜工具配对的窗口范围 | ✅ AgentSpec + runtime |
+| P1-P4 优先级数字 | `1/2/3/4` | 优先级编号 | ❌ 不开放|
+### 5.3 CheckpointSummarizationProvider —— Checkpoint 主动压缩（开放方式特殊 ✅）
+Agent 主动调一个约定为 `context_checkpoint` 的工具。工具执行成功后，history 里会出现一组普通的 `tool_calls -> tool_output`；只要这个 tool output 的原始结果里带有 linnkit 认可的 checkpoint marker，`CheckpointSummarizationProvider` 就会在下一次上下文构建时清理 checkpoint 之前的旧历史。
+- **保留**：must-keep + 这个 checkpoint 工具对本身 + checkpoint 之前最近 N 对工具交互（默认 N=2，可用 `checkpoint.keepPairsBefore` 覆盖）
+- **清掉**：checkpoint 之前更旧的 tool_calls / tool_output / final_answer / thought / 旧 history_summary
+linnkit 提供协议（`CHECKPOINT_MARKER_TYPE` / `CheckpointSummarizationProvider` / SystemReminder & step-reset 联动）+ 最小工具（`ContextCheckpointTool`）；`taskstate` / shared memory 等 host 状态扩展由接入方负责，可通过下面的 hook 接入。
+最小接入：
+```ts
+import { ContextCheckpointTool } from '@linnlabs/linnkit/runtime-kernel';
+export const tools = [
+  new ContextCheckpointTool(),
+];
+```
+如果你改工具名，必须同时改 `contextPolicy.checkpoint.triggerToolName`：
+```ts
+const checkpointTool = new ContextCheckpointTool({ name: 'phase_checkpoint' });
+contextPolicy: {
+  profileId: 'agent',
+  checkpoint: {
+    triggerToolName: 'phase_checkpoint',
+  },
+}
+```
+如果 host 有自己的状态系统，可以用 hook 扩展 payload / observation：
+```ts
+const checkpointTool = new ContextCheckpointTool({
+  extraParameters: {
+    taskstate: {
+      type: 'object',
+      description: 'Host task state snapshot',
+    },
+  },
+  buildPayloadExtension: async ({ args, context }) => {
+    // 可选：写入 host 自己的 TaskState / Memory / 文件系统。
+    // 返回值会合并到 tool result data 中，但 _type 与 summary 由 linnkit 固定写回。
+    return {
+      conversation_id: context.conversationId,
+      taskstate: args.taskstate,
+    };
+  },
+});
+```
+> 注意：`CheckpointSummarizationProvider` 严格读取 `tool_output.metadata.raw_output` 里的 marker，而不是解析展示给模型看的 observation 文本。这是为了避免普通工具输出碰巧像 JSON 时误触发 checkpoint。
+**与 summarization 的关键区别**：
+| 维度 | summarization | checkpoint |
+|------|---------------|-----------|
+| 谁触发 | linnkit 在 token 超阈值时**被动**触发 | agent 主动判断（"完成了一个阶段任务"等）**主动**触发 |
+| 体感 | 文本摘要，丢得多 | 工具对形态，保留 agent 自己的总结 + task state |
+| 何时 | 上限附近 | 任何时候 |
+| 颗粒度 | 较粗 | agent 自己控制颗粒 |
+**配置位置 / 开放状态**（完整开放面清单见 §11）：
+- ✅ **启用方式**：把 `ContextCheckpointTool` 注册进 agent 的工具集即可；不想用就不注册
+- ✅ **改工具名**：`contextPolicy.checkpoint.triggerToolName` 同时控制裁剪识别、GraphExecutor step-reset、SystemReminder 文案——改名必须确保对应工具真实注册进 agent
+- ✅ **marker 协议**：`CHECKPOINT_MARKER_TYPE` framework 内固定；自定义工具也必须输出这个 marker
+### 5.4 自动 SummarizationProvider —— 超预算被动摘要（注册 agent 可配置 ✅）
+当 token 总用量超过阈值，把最旧的一批消息丢给一个**专用的摘要 agent**，让它生成一段总结，替换掉这批旧消息。
+**可配置字段**：
+| 字段 | 默认 | 含义 | 开放状态 |
+|------|------|------|---------|
+| `summarization.triggerThreshold` | `0.70` | 超过总预算的多少比例触发 | ✅ AgentSpec |
+| `summarization.budgetPercentage` | `0.12` | 摘要文本本身的 token 长度上限占比 | ✅ AgentSpec |
+| `summarization.oldestMessagesPercentage` | `0.75` | 选取多大比例的最老消息进摘要 | ✅ AgentSpec |
+| 摘要 agent + 失败行为 | `summarization.agentId` / `failureBehavior`；摘要必须通过 host 注册 agent/chat 调用 | ✅ AgentSpec + runtime |
+| 摘要失败的 fatal 判断 | 通过 `ContextProviderError({ code: 'SUMMARIZATION_FAILED', fatal: true })` 抛出 | ✅ 协议化 |
+**摘要 agent 的注册边界**：framework 不持有摘要 prompt 正文，也不直接发起裸 LLM call。它只把 `summarization.agentId` 放进 `GenerateRequest.promptKey`，由 host 通过自己的注册表解析成一个无工具摘要 agent/chat，再按该注册项的 prompt、模型策略与执行方式完成调用。host 可以把默认摘要 agent 注册为 `history_compression`，也可以在 `contextPolicy.summarization.agentId` 中为单个 agent 指定别的注册项。
+**最小注册示例**（在 host 侧先注册摘要 agent，再在业务 spec 里填 `agentId`）见 [`agent-registration-guide.md`](./agent-registration-guide.md) §4.2。
+**失败行为**：
+| `failureBehavior` | 行为 |
+|-------------------|------|
+| `'fail-fast'`（默认）| 摘要失败立即抛 typed fatal `ContextProviderError`，保持旧行为 |
+| `'continue-if-within-budget'` | 只有当前上下文仍在预算内时才允许继续使用原始消息；如果已经超预算，仍然 fail-fast |
+---
+## 6. System Reminder（注册表 + AgentSpec 已接线 ✅，**有一项不开放**）
+根据当前 tick 的状态（步数、phase、工具调用次数等）在**最后一条 message 末尾**追加一段 `<system-reminder>...</system-reminder>`，利用 LLM 注意力的末尾效应做行为引导。
+**核心设计原则**（重要，你草稿里有一处理解偏差，看下面）：
+| 不变量 | 说明 |
+|--------|------|
+| ✅ 只对当前 tick 生效 | 不写入 history、不持久化、不产生 RuntimeEvent |
+| ✅ 注入位置固定 | 最后一条 message 的 content 末尾，包裹在 `<system-reminder>` 标签 |
+| ✅ 配置驱动 | 内置规则与 host extraRules 都通过 trigger + contentTemplate 注册表解释 |
+| ❌ **不能配置进短期对话历史** | "可以配置允许进入短期对话历史并持久化"——这条**当前不支持**，是反协议的：reminder 本质是"瞬态状态注入"，进 history 会污染缓存与回放语义。如果产品真有"持久化提示"需求，应该走 fence 通道（`lifetime: 'persisted'`），而不是 reminder |
+**触发方式**：framework 内置 5 条规则，按顺序判定：
+| 规则 ID | 触发条件 | 用途 |
+|---------|---------|------|
+| `max_steps_force_final_answer` | `phase === 'force_final_answer'` | 最后一步强制收尾，禁用工具 |
+| `last_steps_hint` | `remainingSteps <= threshold` | 剩余步数提示 |
+| `tool_call_streak_every_ten` | 本轮工具调用次数 ≥ 10 且为 10 的倍数 | 工具循环过深告警 |
+| `periodic_taskstate_reflection` | `stepCount` 是 30 的倍数 | 长程任务定期反思 |
+| `context_budget_warning` | `stepCount` 达 maxSteps 的 90% 且 agent 有 `checkpoint.triggerToolName` 对应工具 | 上下文即将耗尽，引导调 checkpoint |
+**配置开放状态**：
+| 项 | 开放状态 | 备注 |
+|---|---------|------|
+| 规则触发的阈值（10 / 30 / 90% 等数字）| ✅ AgentSpec + runtime | `systemReminder.thresholds` 覆盖 |
+| 规则文案 | ✅ 注册表 | 内置文案在 runtime template；host extraRules 通过 `contentTemplate` 引用 host 注册模板 |
+| 是否启用某条规则（白名单/黑名单）| ✅ AgentSpec + runtime | `enabledRuleIds` 与 `disabledRuleIds` 二选一 |
+| host 自定义新规则 | ✅ AgentSpec + runtime | `systemReminder.extraRules` 通过 trigger/template 注册表解释 |
+| reminder 进 history（持久化）| 🔴 **不开放且不计划开放** | 见上面不变量第 4 条 |
+**注册式扩展边界**：
+- spec 只写 `extraRules: [{ id, trigger, contentTemplate, contentArgs }]`，不允许写函数。
+- trigger 由 `SystemReminderRegistry.registerTriggerKind(kind, evaluator)` 注册。
+- 文案由 `SystemReminderRegistry.registerContentTemplate(name, template)` 注册。
+- 内置 5 条规则也走同一套解释链路，因此自定义规则、阈值覆盖、启用/禁用规则的行为一致。
+---
+## 7. Tool Output 截断与落盘（AgentSpec 阈值可配置 ✅）
+工具返回结果太长会**两端各处理一次**——一次在执行期、一次在上下文构建期：
+### 7.1 执行期落盘（ToolNode observationGovernance）
+- 工具刚执行完，原始 observation 字符串如果超过阈值，就通过 host 提供的 `ObservationPreviewPort` **写一份完整副本到 ToolOutputStore / 本地文件 / 对象存储**，messages 里只保留 preview + `tool_output_store.blob_id` 指针
+- 截断治理由 `AgentSpec.contextPolicy.toolOutput.observationGovernance` 控制；**存储后端、目录、文件命名规则由 host 的 `ObservationPreviewPort` 配置**，不进入 AgentSpec
+- **开放状态**：阈值与启停已进 AgentSpec + runtime；落盘实现仍由 host 的 `ObservationPreviewPort` 决定
+```ts
+contextPolicy: {
+  profileId: 'agent',
+  toolOutput: {
+    observationGovernance: {
+      enabled: true,
+      maxChars: 20_000,
+      maxLines: 1_200,
+    },
+  },
+}
+```
+接入方实现自己的 `ObservationPreviewPort`，把存储后端 / 路径 / bucket 等参数放在 host 配置里，再传给 `createDefaultGraphExecutor({ observationPreview })`。详细规范见 [`tools.md §6`](./tools.md#6-observationpreviewport配置超长-observation-存储路径)。
+> **续读约束**：如果 host 自定义存储路径，读取 `tool_output://blobs/<blob_id>` 的工具必须使用同一个 store，否则模型拿到 `blob_id` 后无法续读。
+### 7.2 上下文构建期截断（MAX_TOOL_PAIR_TOKENS）
+工具历史进 working memory 时，单对工具 token 总量超过 `maxPairTokens` 会触发 `ToolOutputSummarizer` 把 `tool_output` 压缩成短文本（目标长度由 `maxOutputSummaryTokens` 控制）。默认值见 [`tool-history.md §2`](./tool-history.md)。
+**两层独立、各管各的**：执行期落盘解决"原始观察值过大不该塞进 wire"；上下文构建期截断解决"历史工具结果占用过多预算"。
+---
+## 8. Reasoning / Thought 保留策略（AgentSpec 已运行时接线 ✅）
+部分 LLM provider 会返回 `reasoning_content`（思考过程文本），有些模型在能看到之前 reasoning 历史时表现更好——所以 linnkit 把 `thought` 当作一类 AiMessage 保留。
+**当前可配置且已接入 runtime**：
+| 项 | 默认 | 开放状态 |
+|---|------|---------|
+| 工作记忆里保留的最近 thought 数量 | `reasoningRetention.keepLatestThoughts = 1` | ✅ AgentSpec + runtime |
+| Provider sidecar replay 行为（reasoning_details 缺失时怎么办）| `'allow'` / `'degrade_to_text'` / `'provider_empty_replay_field'` | ✅ `contextPolicy.providerReplay` 可覆盖；未配置时 host 仍可按模型默认注入 |
+默认生产运行时保留**1 条**（最新的那条 thought）。如果需要保留多轮 reasoning，可在 AgentSpec 中设置 `reasoningRetention.keepLatestThoughts`，该字段会透传到 `AgentWorkingMemoryProvider`。
+Provider replay 是另一件事：它不决定"保留几条 thought"，而决定"历史工具组缺少 provider sidecar 时怎么回放"。配置例子：
+```ts
+contextPolicy: {
+  profileId: 'agent',
+  providerReplay: {
+    provider: 'system_default',
+    requiresReasoningDetailsForToolReplay: true,
+    missingSidecarBehavior: 'provider_empty_replay_field',
+  },
+}
+```
+边界：如果 `providerReplay` 不配置，linnkit 不会按 `model_id` 自己猜 provider；host 仍可以通过 `resolveToolReplayProtocolPolicy` 按模型提供默认策略。单个 agent 的 `contextPolicy.providerReplay` 优先级高于 host 的模型默认策略。
+---
+## 9. Token 预算与估算
+### 9.1 字段速查
+| 字段 | 默认 | 含义 | 开放状态 |
+|------|------|------|---------|
+| `budget.maxTokens` | `120000` | 总预算 | ✅ AgentSpec |
+| `budget.reservedForResponse` | `2400` | 留给响应的 token | ✅ AgentSpec |
+| `budget.workingMemoryBudgetPercentage` | `0.70` | 工作记忆占可用预算的比例 | ✅ AgentSpec |
+| `tokenEstimation.encoding` | `'cl100k_base'` | 估算用的 tiktoken encoding 名 | ✅ AgentSpec + runtime |
+| `tokenEstimation.avgCharsPerToken` | `2.0` | tiktoken 不可用或未配置 encoding 时的字符/token 兜底比 | ✅ AgentSpec + runtime |
+| `tokenEstimation.toolCallOverhead` | `50` | 工具调用本身的额外开销估算 | ✅ AgentSpec + runtime |
+### 9.2 谁来算 token？
+> 本文档把"计算 token 的方法"统称为 **tokenizer**。这是一个**总称**——既包括 linnkit 内置的默认 tokenizer（基于 tiktoken + 字节比兜底），也包括 host 注入的任何自定义实现。所有运行期上下文预算决策都通过当前生效的 tokenizer 完成。
+**linnkit 协议层既定事实**：
+- linnkit **内置一个默认 tokenizer**（实现：`TokenCalculator` + `tiktoken@^1.0.22` 硬依赖）—— 主路径走 OpenAI 编码族 + CJK 检测；非 OpenAI 模型（Claude / Gemini / DeepSeek）映射到 `cl100k_base` 近似；tiktoken 失败时退到字节比兜底（`avgCharsPerToken`）。
+- runtime 统一通过 `tokenizer.estimateMessage(...)` 估算 message token，预算判断会同时计入基础 message overhead、内容 token、tool call 参数 token 与 `tokenEstimation.toolCallOverhead`。如果 `encoding` 不可用，才回退到 `avgCharsPerToken`。
+- 这个 tokenizer **仅用于 budget 决策**（"还能塞多少消息"），**不用于**计费——计费 token 数由 provider 返回的 `usage` 字段决定，host 自己消费。
+- linnkit **不发明跨 provider 统一 token 数协议**——每个 host / agent 决定自己用什么 tokenizer（默认内置 / 调三参数 / 完全替换）。
+### 9.3 何时该担心估算不准？
+| 场景 | 估算精度 | 是否需要担心 |
+|------|---------|------------|
+| host 用 GPT-3.5/4 + 默认 `cl100k_base` | 几乎精确（OpenAI tiktoken 就是这个）| ❌ 不需要 |
+| host 用 GPT-4o + `encoding: 'o200k_base'` | 几乎精确 | ❌ 不需要 |
+| host 用 Claude / Gemini / DeepSeek + 默认 `cl100k_base` | ±10-30% 偏差 | ⚠️ 大多数场景**够用**（budget 有 `reservedForResponse` 安全垫）；如果你严格按真实计费做预算 → 需要担心 |
+| host 主要场景是中文 / CJK | `TokenCalculator` 自动按字节比兜底 → 比较准；但 tiktoken 主路径仍按 OpenAI 编码估，CJK 字符占 token 偏高 | ⚠️ 调 `avgCharsPerToken: 1.6 ~ 1.8` 提升精度 |
+| host 自动化复杂任务（步骤多、工具链长，单次 run 几十万 token）| 默认估算累积偏差可能放大 | ⚠️ 考虑注入 `TokenizerPort`（已可用） |
+| host 严格按计费 token 数 = 预算 token 数（无安全垫）| 默认估算不够 | ❌ **必须**注入 `TokenizerPort`（已可用） |
+### 9.4 用自定义 tokenizer 替换默认实现（`TokenizerPort` 注入）
+`TokenizerPort` 是**所有 tokenizer 的协议接口**——linnkit 默认 tokenizer (`DefaultTokenizerPort`) 实现它，host 想替换默认实现时也实现它即可。
+**何时该替换默认 tokenizer**：如果你需要**真实**的 Anthropic / Gemini tokenizer（不接受 OpenAI 编码近似），或者你接的是 linnkit 不认识的私有模型，就实现 `TokenizerPort` 注入到装配链路。
+#### 9.4.1 接入点 · `ContextManagerBaseOptions.tokenizer`
+`tokenizer` 注入点在 **context-manager 装配链路**（不是 `GraphExecutor`——GraphExecutor 不负责上下文构建，真正做 token budget / trimming 的是 context-manager）。常见三个装配入口都接受 `tokenizer` 选项：
+| 装配入口 | 字段 | 适用场景 |
+|---------|------|---------|
+| `new AgentContextManager({ ..., tokenizer, tokenizerModelId })` | ✅ | host 直接装配 agent context manager |
+| `new AgentMessageOrchestrator({ ..., tokenizer })` | ✅ | host 装配 orchestrator（orchestrator 透传给底层 context-manager）|
+| `new ChatContextManager({ ..., tokenizer })` / `new ChatMessageOrchestrator({ ..., tokenizer })` | ✅ | chat profile |
+参考实现：`defaultGraphExecutorContextBuilder.ts` 已经把可选 `tokenizer` 依赖透传到 `AgentMessageOrchestrator` / `ChatMessageOrchestrator` 装配，外部接入方可以照抄。
+#### 9.4.2 完整示例
+```ts
+import type { TokenizerPort, LlmRequestMessage } from '@linnlabs/linnkit/ports';
+import { agentOrchestration } from '@linnlabs/linnkit/context-manager';
+class MyMultiProviderTokenizer implements TokenizerPort {
+  estimateText(text: string, modelId?: string): number {
+    if (modelId?.startsWith('claude-')) {
+      return runClaudeTokenizer(text);   // host 自接 Anthropic 官方
+    }
+    if (modelId?.startsWith('gemini-')) {
+      return runGeminiTokenizer(text);
+    }
+    return runTiktoken(text, 'o200k_base');
+  }
+  estimateMessage(message: LlmRequestMessage, modelId?: string): number {
+    // 必须包含 message overhead + tool_call overhead + tool_call_id 层级
+    // 否则 budget 决策会系统性低估
+    // ...
+  }
+}
+const orchestrator = new agentOrchestration.AgentMessageOrchestrator({
+  tokenBudget,
+  processing,
+  taskResolver,
+  providerRegistry,
+  tokenizer: new MyMultiProviderTokenizer(),
+});
+```
+如果你的 host 有自己的 `GraphExecutorContextBuilder`，就在创建 `AgentMessageOrchestrator` / `ChatMessageOrchestrator` 的地方把同一个 `tokenizer` 透传进去。`GraphExecutor` 本身不构建上下文，因此不接收 tokenizer。
+#### 9.4.3 `tokenizerModelId` 字段
+`ContextManagerBaseOptions` 还提供 `tokenizerModelId?: string`——host 在装配期声明"这个 context-manager 接的是哪个模型"，linnkit 内部会把它透传给 `tokenizer.estimateMessage(message, modelId)` / `tokenizer.estimateText(text, modelId)`。当 host 在多 agent 场景下用不同模型时，这个字段让自定义 tokenizer 能精准路由。
+#### 9.4.4 与 `tokenEstimation` 三参数的关系
+- **host 注入的自定义 tokenizer 优先级最高**：注入后，`tokenEstimation` 三参数不再影响预算决策。
+- **`tokenEstimation` 仅服务"用默认 tokenizer"的 host**：它是 `DefaultTokenizerPort` 的配置点（调 encoding / 字节比 / 工具开销）。默认 tokenizer 仍响应 `tokenEstimation` config 的运行时更新。
+- **同时配置不会冲突**：linnkit 内部维护 `hasCustomTokenizer` 标志，注入后即认定 host 完全接管 token 估算。
+#### 9.4.5 C12 不变量 · 协议守门
+`testkit/context-harness` 提供 `C12_HOST_TOKENIZER_DRIVES_BUDGET` 严格不变量：
+- 校验 `message-decision.tokens` 必须等于 host 注入的 `TokenizerPort.estimateMessage(...)`
+- 校验 `trace.finalTokens` 必须等于 host tokenizer 对 finalMessages 的总估算
+- **只在测试上下文传入 tokenizer 时启用**——不打扰沿用默认 tokenizer 的旧测试
+这条不变量是 host 集成自定义 tokenizer 后**最有价值**的回归测试守门——它能在协议层证明"host 的 tokenizer 真的在驱动 budget 决策"，而不是被默认实现静默兜底。
+#### 9.4.6 testkit · `createMockTokenizerPort`
+写测试时不需要自接真实 tokenizer。testkit 提供 `createMockTokenizerPort()`，让你能注入"每条 message 返回固定 N token"的 mock，方便验证 overflow / trimming / contextTrace 行为：
+```ts
+import { createMockTokenizerPort } from '@linnlabs/linnkit/testkit';
+const mockTokenizer = createMockTokenizerPort({ tokensPerMessage: 100 });
+// 注入到测试 harness，验证当总 token 超过 budget.maxTokens 时的 trimming 行为
+```
+### 9.5 边界提醒
+- **tokenizer 是装配期一次性注入**——无论 host 注入还是用默认实现，运行时不支持热替换（避免 budget 决策因为 tokenizer 抖动而失真）。
+- **replay 场景**：未来 Replay SDK 重演 run 时，host 需要重新注入对应的 tokenizer——这是 host 责任，不是 framework 协议负担。
+- **自定义 tokenizer 必须保持与默认实现一致的"额外开销层级"**（message overhead / tool_call overhead / tool_call_id），否则 budget 决策会偏低、消息塞超。
+---
+## 10. 出关：`formatAgentLlmMessages`
+把所有 AiMessage 翻译成最终 LLM 协议 wire 格式（具体调哪个 provider 这里无关）；fence 消息走 host 提供的 `formatter` 包成字面标签；`tool_calls` / `tool_output` 按 LLM 协议挂正确的 role。
+**配置面**：
+- fence formatter（host 决定围栏字面长什么样）
+- LLM provider 自己的 codec（OpenAI Chat / Anthropic Messages / DeepSeek 等）—— 详见 [`llm-provider.md`](./llm-provider.md)
+---
+## 10.5 ContextTrace：解释这次上下文为什么长这样
+`contextTrace` 是本次 context build 的机器可读旁路记录。它不进入 LLM messages、不落成历史事实，只跟随 `ContextBuildResult.contextTrace` 返回，用来解释 effective policy、每个 provider 的 token 增减、以及每条消息最终被保留还是裁掉。
+**配置面**：
+```ts
+contextPolicy: {
+  profileId: 'agent',
+  contextTrace: {
+    enabled: true,
+    includeMessageIds: true,
+    includeTokenBreakdown: true,
+    maxTraceEvents: 200,
+  },
+}
+```
+**输出里会看到**：
+- `effectivePolicy`：本次实际生效的 `contextPolicy`（已经合并 framework 默认、host fallback、agent spec）。
+- `provider` 事件：每个 provider 执行前后保留消息数、token delta、剩余预算、命中的策略名。
+- `message-decision` 事件：每条候选消息的 `keep/drop` 结果、阶段、token、原因；`includeMessageIds=false` 时不会带 message id。
+- `overflowed`：trace 事件超过 `maxTraceEvents` 时为 `true`，防止观测数据反过来膨胀。
+- GraphExecutor 会把 `contextTrace` 从 context builder 透传到 context audit record；runtime-kernel 只按 `unknown` 透传，不反向依赖 context-manager 类型。
+**边界**：ContextTrace 不是 DevTools，也不是 PromptTrace 可视化；它只提供最小可观测闭环。跨 run prompt diff、图形化时间线、长期审计落库属于阶段 2。
+---
+## 11. 当前开放面 vs 未开放面
+### ✅ 已通过 AgentSpec 协议化开放，且 runtime 已接线
+- `budget.maxTokens` / `reservedForResponse` / `workingMemoryBudgetPercentage`
+- `toolHistory.{strategy, keepLatestToolPairs, keepLatestRuns, maxInteractionGroups, overflowStrategy, maxPairTokens, maxOutputSummaryTokens}`
+- `toolOutput.observationGovernance.{enabled, maxChars, maxLines}`
+- `providerReplay.{provider, requiresReasoningDetailsForToolReplay, missingSidecarBehavior}`
+- `summarization.{triggerThreshold, budgetPercentage, oldestMessagesPercentage, agentId, failureBehavior}`
+- `MustKeepPolicy.{alwaysKeepTypes, alwaysKeepFenceKinds, truncationRules}`
+- `workingMemory.{maxRecentToolInteractions, minToolInteractionsToKeep, toolPairingSearchRange}`
+- `checkpoint.{keepPairsBefore, triggerToolName}`
+- `reasoningRetention.keepLatestThoughts`
+- `tokenEstimation.{encoding, avgCharsPerToken, toolCallOverhead}`
+- `systemReminder.{enabledRuleIds, disabledRuleIds, thresholds, extraRules}`
+- `contextTrace.{enabled, includeMessageIds, includeTokenBreakdown, maxTraceEvents}`
+- `defineContextPolicy()` 可补齐 12 大分组默认值，便于外部接入方生成完整策略
+- fence 注册（`FenceRegistry`，host 自由扩展）
+### 🔴 当前不开放（未来可能开放）
+- Preprocessor pipeline **顺序与白名单**（host 现在只能在默认 pipeline 之外追加，不能改默认顺序）
+### 🚫 协议性不开放（不计划开放）
+- system reminder **持久化进 history**（违反 reminder 协议本质——若需持久化请走 fence `lifetime: 'persisted'`）
+- ContextProvider 三阶段顺序（核心 → 工作记忆 → 摘要）
+- 工具压缩的 P1-P4 优先级数字
+- `tool_calls` / `tool_output` 配对不变量
+---
+## 12. 想动哪一层
+| 你想做什么 | 应该动哪里 | 验证方式 |
+|------------|------------|----------|
+| 控制总预算 / 预留响应 token | `contextPolicy.budget` | `ContextTrace.effectivePolicy` + final token usage |
+| 控制工具历史保留方式 | `contextPolicy.toolHistory` | `ContextTrace.message-decision` 中 tool_calls / tool_output 的 keep/drop |
+| 控制摘要何时触发、用哪个摘要 agent | `contextPolicy.summarization` | summary event + `ContextTrace.provider` 中 summarization provider token delta |
+| 必保留某类 host 上下文 | `contextPolicy.mustKeep.alwaysKeepFenceKinds` | fence 对应 message 的 decision 为 `kept_by_CORE_CONTEXT` |
+| 调整工作记忆工具组数量 | `contextPolicy.workingMemory` | working-memory provider 后的 kept count / token delta |
+| 改 checkpoint 工具名或保留窗口 | `contextPolicy.checkpoint` | checkpoint provider 策略命中 + GraphExecutor step-reset 行为 |
+| 控制 thought 保留数量 | `contextPolicy.reasoningRetention.keepLatestThoughts` | thought message 的 keep/drop 数量 |
+| 控制工具 observation 执行期预览阈值 | `contextPolicy.toolOutput.observationGovernance` | `tool_output_store.blob_id` 是否生成 + tool node 单测 |
+| 控制 provider sidecar 缺失时的历史工具回放 | `contextPolicy.providerReplay` | `ToolReplayProtocolGuardPreprocessor` 是否降级 / 标记 |
+| 调整 token 估算口径 | `contextPolicy.tokenEstimation` | provider token delta 曲线变化 |
+| 自定义 transient system reminder | `contextPolicy.systemReminder` + registry | `systemReminderHitRuleIds` + final LLM input |
+| 看清最终 token 决策 | `contextPolicy.contextTrace.enabled=true` | `ContextBuildResult.contextTrace` |
+---
+## 13. 声明你的第一个 system reminder
+SystemReminder 是**当前 tick 的瞬态提醒**，不会进入历史。内置规则可通过 `enabledRuleIds` / `disabledRuleIds` / `thresholds` 控制；host 自定义规则走 trigger/template 注册表。
+```ts
+contextPolicy: {
+  profileId: 'agent',
+  systemReminder: {
+    enabledRuleIds: ['last_steps_hint', 'context_budget_warning'],
+    thresholds: {
+      lastStepsHintThreshold: 2,
+      budgetWarningRatio: 0.85,
+    },
+  },
+}
+```
+自定义规则示意：
+```ts
+import { systemReminder } from '@linnlabs/linnkit/runtime-kernel';
+systemReminder.defaultSystemReminderRegistry.registerContentTemplate(
+  'memoryDensityWarning',
+  (_ctx, args) => `请先整理 ${String(args.resourceName ?? 'memory')} 的关键信息，再继续调用工具。`,
+);
+contextPolicy: {
+  profileId: 'agent',
+  systemReminder: {
+    extraRules: [
+      {
+        id: 'memory-density-warning',
+        trigger: { kind: 'tool-call-streak', threshold: 5 },
+        contentTemplate: 'memoryDensityWarning',
+        contentArgs: { resourceName: 'memory_recall' },
+      },
+    ],
+  },
+}
+```
+**注意**：
+- 不要把 reminder 持久化进 history；需要持久化提示时走 fence。
+- spec 里只放 trigger/template ID 和可序列化参数，不放函数。