npm - evolclaw - Versions diffs - 3.2.0 → 3.4.0 - Mend

evolclaw 3.2.0 → 3.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (95) hide show

package/CHANGELOG.md +53 -0
package/README.md +7 -4
package/dist/agents/{resolve.js → baseagent.js} +34 -5
package/dist/agents/claude-runner.js +120 -31
package/dist/agents/codex-app-server-client.js +364 -0
package/dist/agents/codex-runner.js +1152 -140
package/dist/agents/gemini-runner.js +2 -2
package/dist/agents/runner-types.js +58 -0
package/dist/aun/aid/store.js +1 -1
package/dist/aun/outbox.js +14 -2
package/dist/aun/storage/download.js +1 -1
package/dist/aun/storage/upload.js +13 -1
package/dist/channels/aun.js +869 -358
package/dist/channels/dingtalk.js +77 -140
package/dist/channels/feishu.js +125 -154
package/dist/channels/qqbot.js +75 -138
package/dist/channels/wechat.js +75 -136
package/dist/channels/wecom.js +75 -138
package/dist/cli/agent-command.js +591 -0
package/dist/cli/agent.js +23 -8
package/dist/cli/aun-commands.js +1444 -0
package/dist/cli/ctl-command.js +78 -0
package/dist/cli/daemon-commands.js +2707 -0
package/dist/cli/index.js +23 -4905
package/dist/cli/init.js +33 -6
package/dist/cli/model.js +1 -1
package/dist/cli/restart-monitor.js +539 -0
package/dist/cli/stats.js +558 -0
package/dist/cli/version.js +87 -0
package/dist/cli/watch-logs.js +33 -0
package/dist/cli/watch-msg.js +5 -2
package/dist/config-store.js +12 -6
package/dist/core/channel-loader.js +88 -83
package/dist/core/command/command-handler.js +1189 -0
package/dist/core/command/menu-handler.js +1478 -0
package/dist/core/command/slash-gate.js +142 -0
package/dist/core/command/slash-handler.js +2090 -0
package/dist/core/evolagent-registry.js +82 -0
package/dist/core/evolagent.js +17 -1
package/dist/core/interaction-router.js +8 -0
package/dist/core/message/command-handler-agent-control.js +63 -1
package/dist/core/message/im-renderer.js +91 -51
package/dist/core/message/items-formatter.js +9 -1
package/dist/core/message/message-bridge.js +73 -24
package/dist/core/message/message-log.js +1 -0
package/dist/core/message/message-processor.js +432 -94
package/dist/core/message/message-queue.js +70 -2
package/dist/core/message/pending-hints.js +232 -0
package/dist/core/model/model-catalog.js +1 -1
package/dist/core/model/model-scope.js +2 -2
package/dist/core/permission.js +25 -12
package/dist/core/relation/peer-identity.js +16 -1
package/dist/core/session/adapters/codex-session-file-adapter.js +4 -2
package/dist/core/session/session-manager.js +86 -26
package/dist/core/session/session-title.js +26 -0
package/dist/core/stats/billing.js +151 -0
package/dist/core/stats/budget.js +93 -0
package/dist/core/stats/db.js +334 -0
package/dist/core/stats/eck-vars.js +84 -0
package/dist/core/stats/index.js +10 -0
package/dist/core/stats/normalizer.js +78 -0
package/dist/core/stats/query.js +760 -0
package/dist/core/stats/writer.js +115 -0
package/dist/core/trigger/manager.js +34 -0
package/dist/core/trigger/parser.js +9 -3
package/dist/core/trigger/scheduler.js +20 -17
package/dist/data/error-dict.json +7 -0
package/dist/{agents → eck}/manifest-engine.js +20 -1
package/dist/{agents → eck}/message-renderer.js +24 -1
package/dist/index.js +174 -9
package/dist/ipc.js +116 -1
package/dist/utils/cross-platform.js +58 -5
package/dist/utils/ecweb-launch.js +49 -0
package/dist/utils/ecweb-pair.js +20 -0
package/dist/utils/error-utils.js +18 -5
package/dist/utils/npm-ops.js +38 -8
package/dist/utils/stats.js +77 -6
package/kits/docs/evolclaw/INDEX.md +3 -1
package/kits/docs/evolclaw/fs-architecture.md +1215 -0
package/kits/docs/evolclaw/fs.md +131 -0
package/kits/docs/evolclaw/group-fs.md +209 -0
package/kits/docs/evolclaw/stats.md +70 -0
package/kits/docs/venues/aun-group.md +29 -6
package/kits/docs/venues/group.md +5 -4
package/kits/eck_message_manifest.json +30 -3
package/kits/rules/05-venue.md +1 -1
package/kits/templates/message-fragments/inject-default.md +2 -0
package/package.json +5 -6
package/dist/agents/baseagent-normalize.js +0 -19
package/dist/core/command-handler.js +0 -3876
package/dist/core/relation/peer-key.js +0 -16
package/dist/evolclaw-config.js +0 -11
package/dist/utils/channel-helpers.js +0 -46
/package/dist/core/{cache/file-cache.js → daemon-file-cache.js} +0 -0
/package/dist/{agents → eck}/kit-renderer.js +0 -0

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,58 @@
 # Changelog
+## v3.4.0 (2026-06-12)
+### New Features
+- **CLI 模块化** — 将4640行 `command-handler.ts` 和5131行 `cli/index.ts` 拆分为8个专注模块（`command/`、`cli/`子目录），claude-agent-sdk 升级至 ^0.3.170，净减约10000行
+- **ECWeb Monitor 视图** — 新增实时监控页面：进程级 CPU/内存采样（1s 后台循环）、全局统计、per-agent 摘要；IPC 新增 `monitor-snapshot` 处理器
+- **Agent 运行时控制** — ECWeb 支持对每个 agent 执行 start/stop/mute/unmute/queue-clear，stop 中断进行中的模型调用，mute 暂停队列消费同时保留入队消息
+- **`ec watch logs` 多选** — 新增日志类型多选菜单，支持按类型（session/tool/error等）筛选实时聚合日志；`watch.logTypes` 配置默认可选集
+- **AUN 结构化出站 payload** — task status 改走 `notify`（`event/app.task.status`）不入消息历史；activity 逐条结构化（`type:'activity'` + `item`）；notice/error 结构化；`ref_message_id`/`initiator`/`thread_id` 统一透传
+- **Context-aware auto-compact** — 根据 DB 中上次 model call 的实际 context token 记录决策压缩时机，在下一任务开始前执行；DB 新增 `context_tokens`/`max_tokens`/`auto_compact_tokens` 字段
+- **Codex Edit events 统一 diff** — fileChange 映射为 `Edit` tool_use 事件并附带 unified diff，permission 层直接渲染，不重新计算
+- **AUN 群命令 mention 过滤** — broadcast 指令强制要求 @ 触发；`action_card_reply` 归属由消息上下文精确判定
+- **群话题创建权限** — 由 AUN `group.get_admins` 实时查询，仅 owner/admin 可建话题，fail-closed；无权时静默丢弃避免 agent 互相拒绝循环
+- **`/baseagent scope` 参数** — 支持 `session`/`default`/`both` 三档控制切换范围
+- **Session topic rename** — 支持 `/rename` 重命名当前话题会话
+- **evolclaw-web 自动升级** — ECWeb 启动时检测并自动升级新版本，对标 fastaun 升级机制
+- **Agent displayName 解析** — 从 agent.md 本地缓存 + 异步网络拉取 displayName，ECWeb 展示更友好
+### Improvements
+- **用户中断归类** — 新消息/`/stop`/撤回触发的流中断独立为 `task:interrupted` 事件，不计入 `task:error`
+- **统一出站响应投递** — AUN 渠道所有出站路径收敛到 `adapter.send`，消除渠道间重复分支
+- **Feishu Pin→CheckMark 两阶段 ack** — 收到消息先加 Pin（排队中），runner 开始时升级为 CheckMark 并移除 Pin，视觉无空窗
+- **dispatchModeOverride 分离** — 动态覆盖与持久化 `dispatchMode` 解耦，避免一次性覆盖污染会话配置
+- **ECWeb token TTL 延长至30天** — 支持滑动续期；端口被占时杀旧进程而非漂移到 port+1
+- **`evolclaw status` 展示 ECWeb** — 状态命令新增 ECWeb 进程与 HTTP 就绪状态
+### Bug Fixes
+- **话题回复上下文丢失** — `ctl send/file` 在 Feishu 话题内未透传 `replyToMessageId`/`replyInThread`，回复落到主会话气泡
+- **文件标记提前暴露** — 定时 flush（非最终）触发时 `[SEND_FILE:...]` 未过滤，原样发给用户
+- **AUN inbound replyContext 缺字段** — 入站消息未填充 `peerId`/`replyToMessageId`，导致 task.status `initiator` 为空
+- **Codex SSE idle 重连误报错** — SSE 超时重连的空 error 事件被当作任务错误处理
+- **JSON parse error 自动重试** — API 返回 JSON 解析异常时触发指数退避重试
+- **ECWeb 启动就绪检测** — HTTP 探测根路径判断就绪，避免进程存活但 HTTP 未就绪的误判
+## v3.3.0 (2026-06-10)
+### New Features
+- **Thread 会话继承 baseagent** — 创建 thread 会话时自动继承父会话的 `agentId` 及 baseagent 配置，多线程场景无需重新切换
+- **Codex runner 增强** — 新增 CLI 版本检测、streaming delta 支持、server 可用性检查；codex-app-server-client 补充类型定义
+- **Menu 话题管理** — command-handler 新增话题菜单的权限判定（`canReadTopics`/`canDeleteTopic`）与格式化（`buildTopicMenuItem`/`resolveMenuChatType`）
+### Improvements
+- **Channel plugin 接口统一** — `ChannelPlugin` 从 `isEnabled/createChannel/createChannels` 收敛为单一 `createInstance(inst, ctx)` 单实例模型，新增 `ChannelBuildContext` 与 `showActivities` 共享策略；六个渠道（aun/feishu/wechat/dingtalk/qqbot/wecom）同步迁移
+- **ECWeb 控制台重构** — control source 拆分为 `system`（evolclaw/fastaun/evolclaw-web 三包版本与健康检查）和 `triggers`（定时任务管理），前端联动更新
+- **Trigger 失败统计** — Trigger 新增 `failCount`/`lastResult` 字段，scheduler/manager/parser 同步
+- **Runner 类型模块化** — 抽出 `runner-types.ts` 统一共享类型，消除各 runner 重复声明
+- **Agent AID 展示** — `AgentInfo` 新增 `aid` 字段，`ec agent` 命令展示 agent AID
+- **缓存模块更名** — `read-cache` 重命名为 `daemon-file-cache`，语义更清晰
 ## v3.2.0 (2026-06-05)
 ### New Features

package/README.md CHANGED Viewed

@@ -42,7 +42,7 @@ EvolClaw 是一个轻量级 AI Agent 网关系统。它为 Claude Code / Codex
 1. **消息渠道层** (`src/channels/`) - Feishu + WeChat + DingTalk + QQBot + WeCom + AUN 网络
 2. **消息队列层** (`src/core/message/message-queue.ts`) - 会话级串行处理 + 中断支持
-3. **命令处理层** (`src/core/command-handler.ts`) - 斜杠命令处理（CommandHandler 类）
+3. **命令处理层** (`src/core/command/`) - 斜杠命令处理（slash-handler / menu-handler / command-handler）
 4. **消息处理层** (`src/core/message/message-processor.ts`) - 统一事件处理引擎
 5. **会话管理层** (`src/core/session/session-manager.ts`) - 多项目会话管理
 6. **交互路由层** (`src/core/interaction-router.ts`) - 卡片交互回调注册与路由
@@ -190,6 +190,11 @@ evolclaw/
 │   │   └── gemini-runner.ts        # Gemini CLI 封装
 │   ├── aun/                        # AUN 协议工具
 │   ├── core/
+│   │   ├── command/
+│   │   │   ├── command-handler.ts  # 命令派发入口
+│   │   │   ├── slash-handler.ts    # 斜杠命令实现
+│   │   │   ├── menu-handler.ts     # Menu 协议处理
+│   │   │   └── slash-gate.ts       # 权限前置拦截
 │   │   ├── message/
 │   │   │   ├── message-bridge.ts   # 渠道 ↔ 核心消息桥
 │   │   │   ├── message-processor.ts # 统一消息处理引擎
@@ -202,7 +207,6 @@ evolclaw/
 │   │   │   ├── session-fs-store.ts # 文件系统存储原语
 │   │   │   └── session-manager.ts  # 会话管理（多项目支持）
 │   │   ├── trigger/                # 触发器引擎
-│   │   ├── command-handler.ts      # 斜杠命令处理
 │   │   ├── evolagent.ts            # EvolAgent 实体
 │   │   ├── evolagent-registry.ts   # Agent 注册表（扫描/路由/热重载）
 │   │   ├── interaction-router.ts   # 卡片交互回调路由
@@ -250,7 +254,6 @@ evolclaw/
 - `/perm [mode]` - 查看或切换权限模式（auto / edit / default / readonly）
 **系统管理**：
-- `/clear` - 清空对话历史
 - `/compact` - 压缩会话上下文
 - `/rewind <turn>` - 回退会话到指定轮次
 - `/stop` - 中断当前任务
@@ -296,7 +299,7 @@ v3.2 新增进程级身份标识。启动时自动生成 `ec+5位数字.agentid.
 ## 技术栈
 - **运行时**：Node.js >= 22 + TypeScript（ES modules）
-- **AI SDK**：@anthropic-ai/claude-agent-sdk >= 0.2.100、@openai/codex-sdk、Gemini CLI
+- **AI 后端**：@anthropic-ai/claude-agent-sdk >= 0.3.170、Codex CLI app-server、Gemini CLI
 - **消息渠道**：飞书（@larksuiteoapi/node-sdk）、微信（ClawBot ilink API）、钉钉（dingtalk-stream）、QQ频道（pure-qqbot）、企业微信（AI Bot API）、AUN 网络
 - **数据存储**：文件系统（per-chat 目录） + JSONL（CLI 共用）
 - **测试框架**：Vitest

package/dist/agents/{resolve.js → baseagent.js} RENAMED Viewed

@@ -1,14 +1,37 @@
 /**
- * Baseagent credential resolvers.
+ * Baseagent identity + credential resolution.
  *
- * 输入是 Config 形态（`config.agents.<baseagent>` + override）。启动期由 index.ts
- * 从 primaryAgent.config.baseagents 构造一个 syntheticConfig 喂入；各 plugin 的
- * createAgent 也各自构造 syntheticConfig。
+ * 两部分：
+ *  1. normalizeBaseagent —— 把用户输入的各种别名（cc / claude-code / gemini cli …）
+ *     归一到 canonical 标识 + 展示名。
+ *  2. resolve*Config —— 各后端的凭证解析。输入是 Config 形态
+ *     （`config.agents.<baseagent>` + override）。启动期由 index.ts 从
+ *     primaryAgent.config.baseagents 构造一个 syntheticConfig 喂入；各 plugin 的
+ *     createAgent 也各自构造 syntheticConfig。
  */
 import fs from 'fs';
 import path from 'path';
 import os from 'os';
 import { commandExists } from '../utils/cross-platform.js';
+const BASEAGENT_ALIASES = {
+    claude: { canonical: 'claude', displayName: 'Claude Code' },
+    cc: { canonical: 'claude', displayName: 'Claude Code' },
+    'claude-code': { canonical: 'claude', displayName: 'Claude Code' },
+    'claude code': { canonical: 'claude', displayName: 'Claude Code' },
+    claudecode: { canonical: 'claude', displayName: 'Claude Code' },
+    codex: { canonical: 'codex', displayName: 'Codex' },
+    'codex-cli': { canonical: 'codex', displayName: 'Codex' },
+    'codex cli': { canonical: 'codex', displayName: 'Codex' },
+    gemini: { canonical: 'gemini', displayName: 'Gemini CLI' },
+    'gemini-cli': { canonical: 'gemini', displayName: 'Gemini CLI' },
+    'gemini cli': { canonical: 'gemini', displayName: 'Gemini CLI' },
+    geminicli: { canonical: 'gemini', displayName: 'Gemini CLI' },
+    hermes: { canonical: 'hermes', displayName: 'Hermes' },
+};
+export function normalizeBaseagent(input) {
+    const key = String(input || '').trim().toLowerCase().replace(/_/g, '-');
+    return BASEAGENT_ALIASES[key] || { canonical: 'unknown', displayName: input ? String(input) : 'Unknown' };
+}
 function loadClaudeSettings() {
     try {
         const settingsPath = path.join(os.homedir(), '.claude', 'settings.json');
@@ -109,7 +132,13 @@ export function resolveOpenaiConfig(config, override) {
         || config.agents?.codex?.effort
         || config.agents?.codex?.reasoning
         || undefined;
-    return { apiKey, baseUrl, model, effort };
+    const enableRequestUserInput = override?.enableRequestUserInput
+        ?? config.agents?.codex?.enableRequestUserInput
+        ?? true;
+    const approvalsReviewer = override?.approvalsReviewer
+        ?? config.agents?.codex?.approvalsReviewer
+        ?? undefined;
+    return { apiKey, baseUrl, model, effort, enableRequestUserInput, approvalsReviewer };
 }
 export function resolveGoogleConfig(config, override) {
     const googleCfg = config.agents?.gemini;

package/dist/agents/claude-runner.js CHANGED Viewed

@@ -1,6 +1,6 @@
 import { query, forkSession as sdkForkSession, getSessionMessages as sdkGetSessionMessages } from '@anthropic-ai/claude-agent-sdk';
 import { ensureDir } from '../utils/atomic-write.js';
-import { resolveAnthropicConfig } from './resolve.js';
+import { resolveAnthropicConfig } from './baseagent.js';
 import { DEFAULT_PERMISSION_MODE } from '../types.js';
 import { renderActionAsText } from '../core/interaction-router.js';
 import { buildEnvelope, sendInteractionPayload } from '../core/message/message-processor.js';
@@ -10,6 +10,8 @@ import os from 'os';
 import { logger } from '../utils/logger.js';
 import { checkBlacklist, checkReadonly, summarizeToolInput } from '../core/permission.js';
 import { encodePath } from '../utils/cross-platform.js';
+import { contextTokensForUsage, usageForContext, isClaudeContextUsageModel, isOneMillionContextModel, realContextWindowForModel, autoCompactWindowForModel } from './runner-types.js';
+export { hasCompact, hasModelSwitcher, hasPermissionController } from './runner-types.js';
 // ── 模型别名解析 ──
 // SDK 内置的别名表可能落后于代理实际可用的最新模型，
 // 因此优先从 {baseUrl}/models 动态获取各系列最新版本，失败则回退静态表。
@@ -97,8 +99,6 @@ function resolveModelAlias(model, baseUrl) {
     // 回退静态表
     return STATIC_MODEL_ALIASES[model] || model;
 }
-/** 支持 1M 上下文窗口的模型 ID 前缀（SDK 通过 `[1m]` 后缀启用）。 */
-const ONE_M_CONTEXT_PREFIXES = ['claude-opus-4-8', 'claude-sonnet-4-6'];
 /**
  * 为支持 1M 上下文的模型追加 `[1m]` 后缀——仅在交给 SDK query() 时调用。
  * 目录与校验层始终使用不带后缀的基础 ID，避免与网关 /models 返回值（无 `[1m]`）冲突。
@@ -106,14 +106,10 @@ const ONE_M_CONTEXT_PREFIXES = ['claude-opus-4-8', 'claude-sonnet-4-6'];
 function applyContextWindow(modelId) {
     if (/\[1m\]$/.test(modelId))
         return modelId; // 已带后缀
-    if (ONE_M_CONTEXT_PREFIXES.some(p => modelId === p))
+    if (isOneMillionContextModel(modelId))
         return `${modelId}[1m]`;
     return modelId;
 }
-/** 根据 SDK model 串（含 [1m] 后缀）返回合适的 autoCompactWindow 值。 */
-function contextWindowFor(sdkModel) {
-    return /\[1m\]$/.test(sdkModel) ? 900000 : 200000;
-}
 /** 解析别名 + 追加 1M 后缀，得到最终交给 SDK 的 model 串。 */
 function resolveSdkModel(model, baseUrl) {
     return applyContextWindow(resolveModelAlias(model, baseUrl));
@@ -168,19 +164,9 @@ class MessageStream {
         }
     }
 }
-// ── 类型守卫 ──
-export function hasModelSwitcher(agent) {
-    return typeof agent.setModel === 'function' && typeof agent.listModels === 'function';
-}
-export function hasPermissionController(agent) {
-    return typeof agent.setMode === 'function' && typeof agent.listModes === 'function';
-}
-export function hasCompact(agent) {
-    return typeof agent.compact === 'function';
-}
 export class AgentRunner {
     name = 'claude';
-    capabilities = { clear: true, compact: true, fork: true };
+    capabilities = { clear: true, compact: true, fork: true, askUserQuestion: true, planApproval: true, fileRewind: 'checkpoint' };
     apiKey;
     model;
     effort;
@@ -383,7 +369,6 @@ export class AgentRunner {
                     },
                     channelId: permCtx.channelId,
                     sessionId,
-                    expiresAt: Date.now() + 5 * 60 * 1000,
                 };
             }
             else {
@@ -411,11 +396,11 @@ export class AgentRunner {
                     },
                     channelId: permCtx.channelId,
                     sessionId,
-                    expiresAt: Date.now() + 5 * 60 * 1000,
                 };
             }
             let cardSent = false;
             try {
+                await permCtx.flushPending?.();
                 const envelope = buildEnvelope({
                     taskId: permCtx.taskId,
                     channel: permCtx.channel ?? permCtx.adapter.channelName,
@@ -433,6 +418,7 @@ export class AgentRunner {
                 logger.warn(`[AgentRunner] AskUserQuestion card send failed for q${i}:`, err);
             }
             if (!cardSent) {
+                await permCtx.flushPending?.();
                 const firstLabel = q.options[0]?.label || '';
                 answers[q.question] = q.multiSelect ? [firstLabel] : firstLabel;
                 if (sendPrompt) {
@@ -530,7 +516,7 @@ export class AgentRunner {
                             else {
                                 resolve(action.trim());
                             }
-                        }, { timeoutMs: 120_000, onTimeout: () => resolve(q.options[0]?.label || ''), initiatorId: permCtx.userId, fallbackCommand: 'ask' });
+                        }, { initiatorId: permCtx.userId, fallbackCommand: 'ask' });
                     });
                     answers[q.question] = answer;
                 }
@@ -606,6 +592,7 @@ export class AgentRunner {
                 },
             };
             try {
+                await permCtx.flushPending?.();
                 const envelope = buildEnvelope({
                     taskId: permCtx.taskId,
                     channel: permCtx.channel ?? permCtx.adapter.channelName,
@@ -663,6 +650,7 @@ export class AgentRunner {
                     buttonArgMap: { approve: '1', reject: '2' },
                 },
             };
+            await permCtx.flushPending?.();
             await sendPrompt(renderActionAsText(fallbackInteraction));
             permCtx.interactionRouter.unmarkWaiting(sessionId);
             return new Promise((resolve) => {
@@ -674,11 +662,12 @@ export class AgentRunner {
                     else {
                         resolve({ behavior: 'allow', updatedInput: input, decisionClassification: 'user_temporary' });
                     }
-                }, { timeoutMs: 300_000, onTimeout: () => resolve({ behavior: 'allow', updatedInput: input, decisionClassification: 'user_temporary' }), initiatorId: permCtx.userId, fallbackCommand: 'ask' });
+                }, { initiatorId: permCtx.userId, fallbackCommand: 'ask' });
             });
         }
         // 无交互能力，发提示后直接 allow
         permCtx?.interactionRouter?.unmarkWaiting(sessionId);
+        await permCtx.flushPending?.();
         await sendPrompt('📋 计划审批\nAI 已完成规划，自动批准执行。');
         return { behavior: 'allow', updatedInput: input, decisionClassification: 'user_temporary' };
     }
@@ -692,6 +681,9 @@ export class AgentRunner {
         const toolUseNames = new Map();
         let turnCount = 0;
         const seenMessageIds = new Set();
+        let lastModelCall;
+        // 流式收集各次大模型调用（fallback：SDK iterations 为空时使用）
+        const collectedCalls = [];
         try {
             for await (const event of sdkStream) {
                 // 提取 session_id（任意 SDK 事件都可能携带）
@@ -700,6 +692,38 @@ export class AgentRunner {
                     this.updateSessionId(sessionId, event.session_id);
                     yield { type: 'session_id', sessionId: event.session_id };
                 }
+                if (event.type === 'stream_event') {
+                    const streamEvent = event.event;
+                    if (streamEvent?.type === 'message_start' && streamEvent.message?.usage) {
+                        lastModelCall = {
+                            uuid: event.uuid,
+                            model: streamEvent.message.model,
+                            tokenUsage: streamEvent.message.usage,
+                        };
+                        // 流式收集：每个 message_start = 一次新的大模型调用
+                        collectedCalls.push({
+                            call_index: collectedCalls.length,
+                            model: streamEvent.message.model ?? callModel ?? this.model,
+                            request_id: event.request_id,
+                            tokenUsage: { ...streamEvent.message.usage },
+                        });
+                    }
+                    else if (streamEvent?.type === 'message_delta' && streamEvent.usage) {
+                        lastModelCall = {
+                            ...lastModelCall,
+                            uuid: lastModelCall?.uuid ?? event.uuid,
+                            tokenUsage: {
+                                ...(lastModelCall?.tokenUsage ?? {}),
+                                ...streamEvent.usage,
+                            },
+                        };
+                        // 将 message_delta 的 usage 合并进当前(最后一次)收集的调用
+                        const last = collectedCalls[collectedCalls.length - 1];
+                        if (last)
+                            last.tokenUsage = { ...last.tokenUsage, ...streamEvent.usage };
+                    }
+                    continue;
+                }
                 // system: compact_boundary → compact
                 if (event.type === 'system' && event.subtype === 'compact_boundary') {
                     yield {
@@ -730,6 +754,18 @@ export class AgentRunner {
                             seenMessageIds.add(msgId);
                         turnCount++;
                     }
+                    if (event.message.usage) {
+                        lastModelCall = {
+                            ...lastModelCall,
+                            messageId: event.message.id,
+                            requestId: event.request_id,
+                            model: event.message.model,
+                            tokenUsage: {
+                                ...event.message.usage,
+                                ...(lastModelCall?.tokenUsage ?? {}),
+                            },
+                        };
+                    }
                     // 统计本轮 base agent 全部输出字符数（text + tool_use input）
                     let turnOutputChars = 0;
                     for (const content of event.message.content) {
@@ -790,19 +826,69 @@ export class AgentRunner {
                     const cleanResult = typeof event.result === 'string'
                         ? event.result.replace(/<thinking>[\s\S]*?<\/thinking>\s*/g, '').trim()
                         : event.result;
-                    // 从 usage 三项求和得到当前上下文占用（与 claude-hud getTotalTokens 相同算法）
+                    // 从 usage 求当前上下文占用。
+                    // Claude：input_tokens 是净输入（不含 cache），三项求和 = 实际上下文长度。
+                    // 非 Claude（DeepSeek/OpenAI 兼容）：cache_read 是服务端 KV cache 不占上下文窗口，
+                    // input_tokens 本身就是完整的上下文输入量。
                     const u = event.usage;
-                    const totalTokens = u
-                        ? (u.input_tokens ?? 0) + (u.cache_creation_input_tokens ?? 0) + (u.cache_read_input_tokens ?? 0)
-                        : 0;
-                    const maxTokens = sdkModel ? contextWindowFor(sdkModel) : 200000;
+                    const effectiveModel = callModel ?? this.model;
+                    const isClaudeModel = isClaudeContextUsageModel(effectiveModel);
+                    const totalTokens = contextTokensForUsage(u, !!isClaudeModel);
+                    const contextWindowTokens = realContextWindowForModel(sdkModel);
+                    const autoCompactTokens = autoCompactWindowForModel(sdkModel);
                     const contextUsage = totalTokens > 0 ? {
                         totalTokens,
-                        maxTokens,
-                        percentage: Math.round((totalTokens / maxTokens) * 100),
+                        maxTokens: contextWindowTokens,
+                        percentage: Math.round((totalTokens / contextWindowTokens) * 100),
+                        autoCompactTokens,
                         model: callModel ?? this.model,
                         effort: callEffort ?? this.effort,
                     } : undefined;
+                    if (lastModelCall?.tokenUsage) {
+                        const lastUsageForContext = usageForContext(lastModelCall.tokenUsage);
+                        const lastTotalTokens = contextTokensForUsage(lastUsageForContext, !!isClaudeModel);
+                        lastModelCall = {
+                            ...lastModelCall,
+                            contextUsage: lastTotalTokens > 0 ? {
+                                totalTokens: lastTotalTokens,
+                                maxTokens: contextWindowTokens,
+                                percentage: Math.round((lastTotalTokens / contextWindowTokens) * 100),
+                                autoCompactTokens,
+                                model: callModel ?? this.model,
+                                effort: callEffort ?? this.effort,
+                            } : undefined,
+                        };
+                    }
+                    const contextUsageForCall = (usage) => {
+                        const callTotalTokens = contextTokensForUsage(usageForContext(usage), !!isClaudeModel);
+                        return callTotalTokens > 0 ? {
+                            totalTokens: callTotalTokens,
+                            maxTokens: contextWindowTokens,
+                            percentage: Math.round((callTotalTokens / contextWindowTokens) * 100),
+                            autoCompactTokens,
+                            model: callModel ?? this.model,
+                            effort: callEffort ?? this.effort,
+                        } : undefined;
+                    };
+                    // 组装 modelCalls：优先 SDK iterations，fallback 流式收集，兜底降级单行。
+                    const callModel_ = callModel ?? this.model;
+                    let modelCalls;
+                    const iterArr = Array.isArray(u?.iterations) && u.iterations.length > 0 ? u.iterations : null;
+                    if (iterArr) {
+                        modelCalls = iterArr.map((it, i) => ({
+                            call_index: i, model: callModel_, tokenUsage: it, contextUsage: contextUsageForCall(it),
+                        }));
+                    }
+                    else if (collectedCalls.length > 0) {
+                        modelCalls = collectedCalls.map(call => ({
+                            ...call,
+                            contextUsage: contextUsageForCall(call.tokenUsage),
+                        }));
+                    }
+                    else if (u) {
+                        // 降级：无逐次数据，写一条累计行
+                        modelCalls = [{ call_index: 0, model: callModel_, tokenUsage: u, contextUsage: contextUsageForCall(u), degraded: true }];
+                    }
                     yield {
                         type: 'complete',
                         result: cleanResult,
@@ -817,6 +903,8 @@ export class AgentRunner {
                         numTurns: event.num_turns,
                         tokenUsage: event.usage,
                         contextUsage,
+                        lastModelCall,
+                        modelCalls,
                     };
                     // result 是 SDK 流的终结事件，不再等待后续（防止 interrupt 后流不关闭导致挂起）
                     return;
@@ -1030,11 +1118,12 @@ export class AgentRunner {
             model: sdkModel,
             ...(callEffort ? { effort: callEffort } : {}),
             ...(this.claudeExecutablePath ? { pathToClaudeCodeExecutable: this.claudeExecutablePath } : {}),
-            autoCompactWindow: contextWindowFor(sdkModel),
+            autoCompactWindow: autoCompactWindowForModel(sdkModel),
             advisorModel: 'haiku',
             canUseTool: canUseToolCallback,
             permissionMode: sdkPermissionMode,
             persistSession: true,
+            includePartialMessages: true,
             enableFileCheckpointing: true,
             hooks: {
                 PreCompact: [{ matcher: '.*', hooks: [preCompactHook] }],