npm - @vellumai/assistant - Versions diffs - 0.6.0 → 0.6.1 - Mend

@vellumai/assistant 0.6.0 → 0.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (285) hide show

package/AGENTS.md +4 -0
package/ARCHITECTURE.md +68 -15
package/Dockerfile +2 -2
package/bun.lock +6 -2
package/docker-entrypoint.sh +32 -1
package/docs/architecture/integrations.md +1 -1
package/docs/architecture/memory.md +21 -24
package/openapi.yaml +538 -3
package/package.json +5 -1
package/src/__tests__/anthropic-provider.test.ts +160 -95
package/src/__tests__/app-dir-path-guard.test.ts +1 -0
package/src/__tests__/app-executors.test.ts +47 -1
package/src/__tests__/app-source-watcher.test.ts +159 -0
package/src/__tests__/checker.test.ts +38 -6
package/src/__tests__/config-schema.test.ts +5 -0
package/src/__tests__/conversation-agent-loop-overflow.test.ts +4 -6
package/src/__tests__/conversation-agent-loop.test.ts +4 -51
package/src/__tests__/conversation-history-web-search.test.ts +1 -1
package/src/__tests__/conversation-runtime-assembly.test.ts +653 -832
package/src/__tests__/conversation-runtime-workspace.test.ts +1 -93
package/src/__tests__/conversation-tool-setup-app-refresh.test.ts +17 -4
package/src/__tests__/conversation-wipe.test.ts +2 -6
package/src/__tests__/conversation-workspace-cache-state.test.ts +6 -12
package/src/__tests__/conversation-workspace-injection.test.ts +25 -26
package/src/__tests__/conversation-workspace-tool-tracking.test.ts +1 -1
package/src/__tests__/copy-composer-tc-templates.test.ts +335 -0
package/src/__tests__/date-context.test.ts +76 -210
package/src/__tests__/db-schedule-syntax-migration.test.ts +16 -1
package/src/__tests__/file-list-tool.test.ts +219 -0
package/src/__tests__/first-greeting.test.ts +1 -1
package/src/__tests__/heartbeat-service.test.ts +180 -3
package/src/__tests__/identity-routes.test.ts +328 -0
package/src/__tests__/injection-block.test.ts +24 -0
package/src/__tests__/install-skill-routing.test.ts +7 -6
package/src/__tests__/jobs-store-qdrant-breaker.test.ts +15 -14
package/src/__tests__/list-messages-tool-merge.test.ts +300 -0
package/src/__tests__/llm-context-normalization.test.ts +18 -18
package/src/__tests__/llm-context-route-provider.test.ts +101 -0
package/src/__tests__/llm-request-log-turn-query.test.ts +162 -0
package/src/__tests__/log-export-workspace.test.ts +72 -105
package/src/__tests__/mcp-abort-signal.test.ts +5 -0
package/src/__tests__/mcp-client-auth.test.ts +5 -0
package/src/__tests__/memory-recall-log-store.test.ts +132 -0
package/src/__tests__/migration-export-streaming.test.ts +304 -0
package/src/__tests__/migration-import-commit-http.test.ts +11 -10
package/src/__tests__/mock-fetch.ts +87 -0
package/src/__tests__/notification-decision-recipient-context.test.ts +282 -0
package/src/__tests__/onboarding-template-contract.test.ts +62 -14
package/src/__tests__/parser.test.ts +32 -0
package/src/__tests__/permission-checker-host-gate.test.ts +452 -0
package/src/__tests__/permission-controls-v2-flag.test.ts +55 -0
package/src/__tests__/permission-mode-sse.test.ts +418 -0
package/src/__tests__/permission-mode-store.test.ts +277 -0
package/src/__tests__/permission-mode.test.ts +101 -0
package/src/__tests__/platform-bash-auto-approve.test.ts +359 -0
package/src/__tests__/profiler-routes.test.ts +502 -0
package/src/__tests__/profiler-run-store.test.ts +441 -0
package/src/__tests__/proxy-approval-callback.test.ts +4 -75
package/src/__tests__/registry.test.ts +1 -1
package/src/__tests__/sandbox-host-parity.test.ts +5 -4
package/src/__tests__/scheduler-reuse-conversation.test.ts +368 -0
package/src/__tests__/scrub-corrupted-image-attachments.test.ts +278 -0
package/src/__tests__/search-skills-unified.test.ts +4 -3
package/src/__tests__/send-endpoint-busy.test.ts +42 -3
package/src/__tests__/set-permission-mode.test.ts +274 -0
package/src/__tests__/skill-load-feature-flag.test.ts +12 -0
package/src/__tests__/skill-memory.test.ts +2 -783
package/src/__tests__/strip-memory-injections.test.ts +187 -0
package/src/__tests__/subagent-detail.test.ts +84 -0
package/src/__tests__/subagent-disposal.test.ts +308 -0
package/src/__tests__/subagent-manager-notify.test.ts +19 -10
package/src/__tests__/subagent-notify-parent.test.ts +390 -0
package/src/__tests__/subagent-role-registry.test.ts +108 -0
package/src/__tests__/subagent-tool-filtering.test.ts +71 -0
package/src/__tests__/subagent-tools.test.ts +464 -4
package/src/__tests__/system-prompt-ask-mode.test.ts +139 -0
package/src/__tests__/task-memory-cleanup.test.ts +12 -12
package/src/__tests__/terminal-tools.test.ts +17 -27
package/src/__tests__/test-preload.ts +4 -0
package/src/__tests__/tool-executor.test.ts +4 -26
package/src/__tests__/tool-side-effects-slack-dm.test.ts +1 -0
package/src/__tests__/top-level-renderer.test.ts +10 -13
package/src/__tests__/trusted-contact-lifecycle-notifications.test.ts +116 -2
package/src/__tests__/workspace-migration-028-recover-conversations-from-disk-view.test.ts +387 -0
package/src/agent/loop.ts +6 -0
package/src/approvals/guardian-request-resolvers.ts +24 -0
package/src/avatar/traits-png-sync.ts +3 -3
package/src/cli/__tests__/run-assistant-command.ts +29 -0
package/src/cli/commands/__tests__/email-download.test.ts +245 -0
package/src/cli/commands/__tests__/email-list.test.ts +192 -0
package/src/cli/commands/__tests__/email-register.test.ts +186 -0
package/src/cli/commands/__tests__/email-send.test.ts +291 -0
package/src/cli/commands/__tests__/email-status.test.ts +181 -0
package/src/cli/commands/__tests__/email-unregister.test.ts +139 -0
package/src/cli/commands/__tests__/routes.test.ts +562 -0
package/src/cli/commands/conversations.ts +1 -8
package/src/cli/commands/email.ts +584 -835
package/src/cli/commands/memory.ts +1 -34
package/src/cli/commands/notifications.ts +7 -2
package/src/cli/commands/oauth/connect.ts +14 -5
package/src/cli/commands/routes.ts +396 -0
package/src/cli/commands/skills.ts +130 -20
package/src/cli/program.ts +2 -0
package/src/cli.ts +1 -120
package/src/config/bundled-skills/app-builder/SKILL.md +4 -1
package/src/config/bundled-skills/gmail/SKILL.md +2 -2
package/src/config/bundled-skills/messaging/SKILL.md +7 -0
package/src/config/bundled-skills/schedule/SKILL.md +22 -2
package/src/config/bundled-skills/schedule/TOOLS.json +8 -0
package/src/config/bundled-skills/settings/tools/avatar-get.ts +3 -13
package/src/config/bundled-skills/settings/tools/avatar-remove.ts +2 -4
package/src/config/bundled-skills/settings/tools/avatar-update.ts +5 -2
package/src/config/bundled-skills/slack/SKILL.md +2 -0
package/src/config/bundled-skills/subagent/SKILL.md +43 -3
package/src/config/bundled-skills/subagent/TOOLS.json +29 -4
package/src/config/env-registry.ts +63 -0
package/src/config/feature-flag-registry.json +17 -1
package/src/config/schema.ts +8 -0
package/src/config/schemas/filing.ts +51 -0
package/src/config/schemas/heartbeat.ts +15 -12
package/src/config/schemas/memory-lifecycle.ts +12 -0
package/src/config/schemas/security.ts +14 -0
package/src/daemon/app-source-watcher.ts +93 -0
package/src/daemon/config-watcher.ts +79 -1
package/src/daemon/conversation-agent-loop-handlers.ts +20 -0
package/src/daemon/conversation-agent-loop.ts +158 -65
package/src/daemon/conversation-history.ts +4 -19
package/src/daemon/conversation-lifecycle.ts +8 -14
package/src/daemon/conversation-process.ts +13 -7
package/src/daemon/conversation-runtime-assembly.ts +300 -306
package/src/daemon/conversation-tool-setup.ts +44 -14
package/src/daemon/conversation-workspace.ts +1 -2
package/src/daemon/conversation.ts +18 -0
package/src/daemon/date-context.ts +26 -53
package/src/daemon/first-greeting.ts +1 -1
package/src/daemon/handlers/conversations.ts +4 -7
package/src/daemon/handlers/shared.test.ts +143 -0
package/src/daemon/handlers/shared.ts +63 -5
package/src/daemon/handlers/skills.ts +11 -18
package/src/daemon/lifecycle.ts +199 -157
package/src/daemon/message-types/conversations.ts +25 -6
package/src/daemon/message-types/messages.ts +9 -1
package/src/daemon/message-types/schedules.ts +1 -0
package/src/daemon/message-types/settings.ts +6 -0
package/src/daemon/profiler-run-store.ts +557 -0
package/src/daemon/server.ts +89 -9
package/src/daemon/shutdown-handlers.ts +5 -0
package/src/daemon/tool-side-effects.ts +23 -3
package/src/export/transcript-formatter.ts +148 -0
package/src/filing/filing-service.ts +228 -0
package/src/heartbeat/heartbeat-service.ts +96 -7
package/src/mcp/client.ts +6 -0
package/src/mcp/mcp-oauth-provider.ts +149 -27
package/src/memory/admin.ts +33 -32
package/src/memory/app-store.ts +69 -0
package/src/memory/conversation-bootstrap.ts +1 -1
package/src/memory/conversation-crud.ts +136 -107
package/src/memory/conversation-group-migration.ts +1 -1
package/src/memory/conversation-queries.ts +58 -12
package/src/memory/conversation-title-service.ts +1 -0
package/src/memory/db-init.ts +182 -376
package/src/memory/graph/bootstrap.ts +75 -66
package/src/memory/graph/capability-seed.ts +167 -15
package/src/memory/graph/consolidation.ts +38 -4
package/src/memory/graph/conversation-graph-memory.ts +133 -104
package/src/memory/graph/extraction-job.ts +9 -4
package/src/memory/graph/extraction.ts +66 -23
package/src/memory/graph/graph-memory-state-store.ts +37 -0
package/src/memory/graph/graph-search.ts +29 -15
package/src/memory/graph/injection.ts +38 -8
package/src/memory/graph/inspect.ts +12 -3
package/src/memory/graph/retriever.ts +365 -262
package/src/memory/graph/store.test.ts +48 -0
package/src/memory/graph/store.ts +150 -11
package/src/memory/graph/tool-handlers.ts +84 -209
package/src/memory/graph/tools.ts +8 -52
package/src/memory/graph/types.ts +24 -0
package/src/memory/job-handlers/cleanup.ts +44 -1
package/src/memory/jobs-store.ts +70 -60
package/src/memory/jobs-worker.ts +44 -28
package/src/memory/llm-request-log-store.ts +96 -12
package/src/memory/memory-recall-log-store.ts +49 -5
package/src/memory/migrations/203-drop-memory-items-tables.ts +33 -1
package/src/memory/migrations/206-memory-graph-node-edits.ts +19 -0
package/src/memory/migrations/206-scrub-corrupted-image-attachments.ts +131 -0
package/src/memory/migrations/207-conversation-graph-memory-state.ts +20 -0
package/src/memory/migrations/208-conversations-last-message-at.ts +35 -0
package/src/memory/migrations/209-strip-thinking-from-consolidated.ts +85 -0
package/src/memory/migrations/210-schedule-reuse-conversation.ts +13 -0
package/src/memory/migrations/211-memory-recall-logs-query-context.ts +21 -0
package/src/memory/migrations/212-llm-request-logs-created-at-index.ts +19 -0
package/src/memory/migrations/index.ts +8 -0
package/src/memory/migrations/registry.ts +8 -0
package/src/memory/schema/conversations.ts +14 -0
package/src/memory/schema/infrastructure.ts +8 -1
package/src/memory/schema/memory-core.ts +0 -51
package/src/memory/schema/memory-graph.ts +15 -0
package/src/memory/task-memory-cleanup.ts +30 -11
package/src/notifications/copy-composer.ts +86 -0
package/src/notifications/decision-engine.ts +35 -0
package/src/permissions/checker.ts +12 -1
package/src/permissions/permission-mode-store.ts +180 -0
package/src/permissions/permission-mode.ts +31 -0
package/src/permissions/workspace-policy.ts +9 -0
package/src/prompts/system-prompt.ts +59 -7
package/src/prompts/templates/BOOTSTRAP-REFERENCE.md +100 -0
package/src/prompts/templates/BOOTSTRAP.md +70 -165
package/src/prompts/templates/HEARTBEAT.md +3 -1
package/src/prompts/templates/SOUL.md +25 -4
package/src/prompts/templates/UPDATES.md +8 -0
package/src/providers/anthropic/client.ts +107 -219
package/src/runtime/auth/route-policy.ts +23 -0
package/src/runtime/http-server.ts +32 -2
package/src/runtime/http-types.ts +12 -1
package/src/runtime/migrations/vbundle-builder.ts +389 -3
package/src/runtime/migrations/vbundle-importer.ts +8 -6
package/src/runtime/routes/__tests__/user-route-dispatcher.test.ts +378 -0
package/src/runtime/routes/app-management-routes.ts +1 -11
package/src/runtime/routes/approval-strategies/guardian-callback-strategy.ts +26 -0
package/src/runtime/routes/archive-utils.ts +29 -0
package/src/runtime/routes/avatar-routes.ts +2 -9
package/src/runtime/routes/btw-routes.ts +14 -1
package/src/runtime/routes/conversation-analysis-routes.ts +173 -0
package/src/runtime/routes/conversation-management-routes.ts +1 -14
package/src/runtime/routes/conversation-query-routes.ts +49 -3
package/src/runtime/routes/conversation-routes.ts +264 -44
package/src/runtime/routes/heartbeat-routes.ts +4 -10
package/src/runtime/routes/identity-routes.ts +53 -18
package/src/runtime/routes/llm-context-normalization.ts +14 -10
package/src/runtime/routes/log-export-routes.ts +23 -275
package/src/runtime/routes/memory-item-routes.test.ts +168 -233
package/src/runtime/routes/migration-routes.ts +18 -7
package/src/runtime/routes/profiler-routes.ts +350 -0
package/src/runtime/routes/schedule-routes.ts +27 -12
package/src/runtime/routes/settings-routes.ts +95 -8
package/src/runtime/routes/subagents-routes.ts +28 -7
package/src/runtime/routes/user-route-dispatcher.ts +223 -0
package/src/runtime/routes/user-routes.ts +41 -0
package/src/runtime/routes/workspace-routes.ts +0 -1
package/src/schedule/schedule-store.ts +30 -0
package/src/schedule/scheduler.ts +45 -18
package/src/skills/catalog-install.ts +10 -2
package/src/skills/managed-store.ts +2 -2
package/src/skills/skill-memory.ts +1 -293
package/src/subagent/index.ts +13 -3
package/src/subagent/manager.ts +308 -29
package/src/subagent/types.ts +68 -0
package/src/tasks/task-runner.ts +4 -4
package/src/tools/apps/executors.ts +29 -4
package/src/tools/filesystem/list.ts +93 -0
package/src/tools/permission-checker.ts +78 -0
package/src/tools/registry.ts +4 -0
package/src/tools/schedule/create.ts +3 -0
package/src/tools/schedule/list.ts +1 -0
package/src/tools/schedule/update.ts +6 -0
package/src/tools/shared/filesystem/errors.ts +5 -0
package/src/tools/shared/filesystem/file-ops-service.ts +90 -2
package/src/tools/shared/filesystem/types.ts +17 -0
package/src/tools/shared/shell-output.ts +31 -2
package/src/tools/subagent/abort.ts +12 -2
package/src/tools/subagent/message.ts +9 -2
package/src/tools/subagent/notify-parent.ts +79 -0
package/src/tools/subagent/read.ts +29 -8
package/src/tools/subagent/resolve.ts +21 -0
package/src/tools/subagent/spawn.ts +2 -0
package/src/tools/subagent/status.ts +11 -1
package/src/tools/system/avatar-generator.ts +3 -3
package/src/tools/system/register.ts +23 -0
package/src/tools/system/set-permission-mode.ts +103 -0
package/src/tools/terminal/parser.ts +30 -5
package/src/tools/terminal/safe-env.ts +16 -1
package/src/tools/tool-manifest.ts +6 -0
package/src/tools/types.ts +2 -0
package/src/util/logger.ts +1 -1
package/src/util/platform.ts +50 -17
package/src/workspace/migrations/023-move-config-files-to-workspace.ts +2 -2
package/src/workspace/migrations/024-move-runtime-files-to-workspace.ts +2 -2
package/src/workspace/migrations/028-recover-conversations-from-disk-view.ts +270 -0
package/src/workspace/migrations/029-seed-pkb.ts +84 -0
package/src/workspace/migrations/registry.ts +4 -0
package/src/workspace/top-level-renderer.ts +5 -9
package/src/__tests__/cli-memory.test.ts +0 -377
package/src/__tests__/clipboard.test.ts +0 -88
package/src/cli/cli-memory.ts +0 -179
package/src/util/clipboard.ts +0 -34

package/src/memory/graph/retriever.ts CHANGED Viewed

@@ -35,7 +35,12 @@ import {
   evaluateTemporalTriggers,
   type TriggeredResult,
 } from "./triggers.js";
-import type { MemoryEdge, MemoryNode, ScoredNode } from "./types.js";
+import type {
+  MemoryEdge,
+  MemoryNode,
+  RetrievalMetrics,
+  ScoredNode,
+} from "./types.js";
 import { isCapabilityNode } from "./types.js";
 const log = getLogger("graph-retriever");
@@ -78,7 +83,7 @@ async function rerankAndDedup(
     const provider = await getConfiguredProvider();
     if (!provider) return candidates.slice(0, maxNodes);
-    // Compact listing for the LLM: numbered index + age + first 100 chars
+    // Numbered listing for the LLM: index + age + full content
     const now = Date.now();
     const listing = candidates
       .map((s, i) => {
@@ -87,11 +92,7 @@ async function rerankAndDedup(
           ageDays < 1
             ? `${Math.floor(ageDays * 24)}h`
             : `${Math.floor(ageDays)}d`;
-        const preview =
-          s.node.content.length > 100
-            ? s.node.content.slice(0, 100) + "…"
-            : s.node.content;
-        return `${i + 1}. (${age}) ${preview}`;
+        return `${i + 1}. (${age}) ${s.node.content}`;
       })
       .join("\n");
@@ -176,10 +177,11 @@ async function dedupForTurn(
   candidates: ScoredNode[],
   maxNodes: number,
   query: string,
-): Promise<ScoredNode[]> {
+): Promise<{ nodes: ScoredNode[]; llmApplied: boolean }> {
   try {
     const provider = await getConfiguredProvider();
-    if (!provider) return candidates.slice(0, maxNodes);
+    if (!provider)
+      return { nodes: candidates.slice(0, maxNodes), llmApplied: false };
     const now = Date.now();
     const listing = candidates
@@ -189,11 +191,7 @@ async function dedupForTurn(
           ageDays < 1
             ? `${Math.floor(ageDays * 24)}h`
             : `${Math.floor(ageDays)}d`;
-        const preview =
-          s.node.content.length > 150
-            ? s.node.content.slice(0, 150) + "…"
-            : s.node.content;
-        return `${i + 1}. (${age}) ${preview}`;
+        return `${i + 1}. (${age}) ${s.node.content}`;
       })
       .join("\n");
@@ -211,6 +209,98 @@ async function dedupForTurn(
       },
     );
+    const toolBlock = extractToolUse(response);
+    if (!toolBlock)
+      return { nodes: candidates.slice(0, maxNodes), llmApplied: false };
+    const input = toolBlock.input as { items?: number[] };
+    if (!input.items?.length)
+      return { nodes: candidates.slice(0, maxNodes), llmApplied: false };
+    const reranked: ScoredNode[] = [];
+    const seen = new Set<number>();
+    for (const num of input.items) {
+      const idx = num - 1;
+      if (idx >= 0 && idx < candidates.length && !seen.has(idx)) {
+        reranked.push(candidates[idx]);
+        seen.add(idx);
+      }
+    }
+    return reranked.length > 0
+      ? { nodes: reranked.slice(0, maxNodes), llmApplied: true }
+      : { nodes: candidates.slice(0, maxNodes), llmApplied: false };
+  } catch (err) {
+    log.warn(
+      { err: err instanceof Error ? err.message : String(err) },
+      "Per-turn dedup+rerank failed, using scored order",
+    );
+    return { nodes: candidates.slice(0, maxNodes), llmApplied: false };
+  }
+}
+// ---------------------------------------------------------------------------
+// Cross-category dedup — dedup-only (no relevance filtering)
+// ---------------------------------------------------------------------------
+const DEDUP_ITEMS_TOOL = {
+  name: "select_items",
+  description:
+    "Select ALL items that survive deduplication. When multiple items describe the same event/fact, keep only the richest version. Do not filter by relevance — keep everything that is not a duplicate.",
+  input_schema: {
+    type: "object" as const,
+    properties: {
+      items: {
+        type: "array" as const,
+        description:
+          "Item numbers to keep (1-indexed). Remove duplicates — when multiple entries describe the same event/fact, keep ONLY the richest version. Keep all non-duplicate items.",
+        items: { type: "number" as const },
+      },
+    },
+    required: ["items"] as const,
+  },
+};
+/**
+ * Dedup-only pass for cross-category duplicate removal. Unlike `dedupForTurn`,
+ * this does NOT filter by relevance to a query — it ONLY removes duplicates
+ * and keeps everything else. Used after context load to catch topic-level
+ * duplicates across reserved categories and serendipity.
+ */
+async function dedupCrossCategory(
+  candidates: ScoredNode[],
+  maxNodes: number,
+): Promise<ScoredNode[]> {
+  try {
+    const provider = await getConfiguredProvider();
+    if (!provider) return candidates.slice(0, maxNodes);
+    const now = Date.now();
+    const listing = candidates
+      .map((s, i) => {
+        const ageDays = (now - s.node.created) / (1000 * 60 * 60 * 24);
+        const age =
+          ageDays < 1
+            ? `${Math.floor(ageDays * 24)}h`
+            : `${Math.floor(ageDays)}d`;
+        return `${i + 1}. (${age}) ${s.node.content}`;
+      })
+      .join("\n");
+    const response = await provider.sendMessage(
+      [userMessage(listing)],
+      [DEDUP_ITEMS_TOOL],
+      `Deduplicate the following numbered items. When multiple items describe the same event, fact, or status, keep ONLY the richest version. Keep ALL items that are not duplicates — do not filter by relevance or topic. Call the select_items tool with every item that survives dedup.`,
+      {
+        config: {
+          modelIntent: "latency-optimized" as const,
+          tool_choice: { type: "tool" as const, name: "select_items" },
+          thinking: { type: "disabled" },
+          temperature: 0,
+        },
+      },
+    );
     const toolBlock = extractToolUse(response);
     if (!toolBlock) return candidates.slice(0, maxNodes);
@@ -233,7 +323,7 @@ async function dedupForTurn(
   } catch (err) {
     log.warn(
       { err: err instanceof Error ? err.message : String(err) },
-      "Per-turn dedup+rerank failed, using scored order",
+      "Cross-category dedup failed, using original order",
     );
     return candidates.slice(0, maxNodes);
   }
@@ -263,6 +353,7 @@ export interface ContextLoadResult {
   serendipityNodes: ScoredNode[];
   triggeredNodes: TriggeredResult[];
   latencyMs: number;
+  metrics: RetrievalMetrics;
 }
 /**
@@ -287,15 +378,21 @@ export async function loadContextMemory(
   // 1. Embed recent conversation summaries as retrieval queries
   let queryVector: number[] | null = null;
+  let embeddingProvider: string | null = null;
+  let embeddingModel: string | null = null;
+  let contextQueryText: string | null = null;
   if (opts.recentSummaries.length > 0) {
     try {
       const queryText = opts.recentSummaries.join("\n\n");
       const truncated =
         queryText.length > 3000 ? queryText.slice(0, 3000) : queryText;
+      contextQueryText = truncated;
       const result = await embedWithRetry(opts.config, [truncated], {
         signal: opts.signal,
       });
       queryVector = result.vectors[0] ?? null;
+      embeddingProvider = result.provider;
+      embeddingModel = result.model;
     } catch (err) {
       log.warn({ err }, "Failed to embed summaries for context load");
     }
@@ -303,7 +400,9 @@ export async function loadContextMemory(
   // 2. Hybrid retrieval from Qdrant (dense search on graph_node points)
   const semanticCandidateIds = new Map<string, number>(); // nodeId → score
+  let hybridSearchLatencyMs = 0;
   if (queryVector) {
+    const searchStart = Date.now();
     try {
       const results = await searchGraphNodes(queryVector, maxNodes * 3, [
         opts.scopeId,
@@ -313,8 +412,11 @@ export async function loadContextMemory(
       }
     } catch (err) {
       log.warn({ err }, "Qdrant search failed for context load");
+    } finally {
+      hybridSearchLatencyMs = Date.now() - searchStart;
     }
   }
+  const pureSemanticHits = semanticCandidateIds.size;
   // Also include top-significance nodes as a fallback
   const topSignificance = queryNodes({
@@ -498,105 +600,15 @@ export async function loadContextMemory(
     },
   );
-  // 6. Reserve slots for recent prospective nodes (commitments, tasks, plans).
-  //    These MUST surface at conversation start regardless of score — if the user
-  //    said "I have a doctor appointment tomorrow," Velissa must remember it.
-  const PROSPECTIVE_RESERVE = 10;
-  const recentProspective = queryNodes({
-    scopeId: opts.scopeId,
-    types: ["prospective"],
-    fidelityNot: ["gone"],
-    createdAfter: nowMs - 3 * 24 * 60 * 60 * 1000, // last 3 days
-    limit: PROSPECTIVE_RESERVE,
-  });
-  // Filter out prospective nodes that have been superseded or resolved.
-  // A "supersedes" or "resolved-by" edge targeting a node means its
-  // content has been replaced by a newer memory — stop force-surfacing it.
-  const unresolvedProspective = recentProspective.filter((node) => {
-    const incoming = getEdgesForNode(node.id, "incoming");
-    return !incoming.some(
-      (e) =>
-        e.relationship === "supersedes" || e.relationship === "resolved-by",
-    );
-  });
-  // Score them so they have breakdowns, but they're guaranteed inclusion
-  const prospectiveIds = new Set(unresolvedProspective.map((n) => n.id));
-  const reservedNodes: ScoredNode[] = unresolvedProspective.map((node) => {
-    const existing = scored.find((s) => s.node.id === node.id);
-    if (existing) return existing;
-    return scoreCandidate(node, {
-      semanticSimilarity: 0,
-      effectiveSignificance: computeEffectiveSignificance(node, nowMs),
-      emotionalIntensity: node.emotionalCharge.intensity,
-      temporalBoost: (computeTemporalBoost(node, now) + 1) / 2,
-      recencyBoost: computeRecencyBoost(node, nowMs),
-      triggerBoost: 0,
-      activationBoost: 0,
-    });
-  });
-  // Reserve slots for upcoming events (nodes with event dates in the future).
-  // Like prospective reservation, these MUST surface — if the user said
-  // "I have a flight Tuesday," the assistant must remember it regardless of score.
-  const UPCOMING_RESERVE = 5;
-  const upcomingEvents = queryNodes({
-    scopeId: opts.scopeId,
-    fidelityNot: ["gone"],
-    hasEventDate: true,
-    eventDateAfter: nowMs,
-    eventDateBefore: nowMs + 30 * 24 * 60 * 60 * 1000, // next 30 days
-    limit: 20, // Fetch extra candidates — post-sort by proximity below
-  });
-  // Sort by event date ascending so soonest events get reserved first
-  // (queryNodes sorts by significance, which would drop a tomorrow-event
-  // with low significance in favor of a 3-weeks-away high-significance one)
-  upcomingEvents.sort((a, b) => (a.eventDate ?? 0) - (b.eventDate ?? 0));
-  const unresolvedUpcoming = upcomingEvents
-    .filter((node) => {
-      if (prospectiveIds.has(node.id)) return false; // already reserved as prospective
-      const incoming = getEdgesForNode(node.id, "incoming");
-      return !incoming.some(
-        (e) =>
-          e.relationship === "supersedes" || e.relationship === "resolved-by",
-      );
-    })
-    .slice(0, UPCOMING_RESERVE);
-  const upcomingIds = new Set(unresolvedUpcoming.map((n) => n.id));
-  const reservedUpcoming: ScoredNode[] = unresolvedUpcoming.map((node) => {
-    const existing = scored.find((s) => s.node.id === node.id);
-    if (existing) return existing;
-    return scoreCandidate(node, {
-      semanticSimilarity: 0,
-      effectiveSignificance: computeEffectiveSignificance(node, nowMs),
-      emotionalIntensity: node.emotionalCharge.intensity,
-      temporalBoost: (computeTemporalBoost(node, now) + 1) / 2,
-      recencyBoost: computeRecencyBoost(node, nowMs),
-      triggerBoost: 0,
-      activationBoost: 0,
-    });
-  });
-  // Remove reserved nodes and all procedural nodes from the main pool.
-  // Procedural nodes have dedicated reserved slots — any that didn't make
-  // the cut shouldn't compete with organic memories for general slots.
-  const mainPool = scored.filter(
-    (s) =>
-      !isCapabilityNode(s.node) &&
-      !prospectiveIds.has(s.node.id) &&
-      !upcomingIds.has(s.node.id),
-  );
+  // 6. Remove procedural nodes from the main pool — they have dedicated
+  //    reserved slots and shouldn't compete with organic memories.
+  //    Prospective/upcoming reserves were removed in favor of the PKB
+  //    (personal knowledge base) which handles commitments and schedule
+  //    via always-loaded flat files.
+  const mainPool = scored.filter((s) => !isCapabilityNode(s.node));
   const mainSlots = Math.max(
     0,
-    maxNodes -
-      serendipitySlots -
-      reservedNodes.length -
-      reservedUpcoming.length -
-      reservedCapabilities.length,
+    maxNodes - serendipitySlots - reservedCapabilities.length,
   );
   // 7. LLM re-ranking on the main pool: dedup + select
@@ -606,18 +618,14 @@ export async function loadContextMemory(
     opts.config,
   );
-  // 8. Combine: reserved prospective + reserved upcoming + reserved capabilities + reranked main pool
-  const deterministic = [
-    ...reservedNodes,
-    ...reservedUpcoming,
-    ...reservedCapabilities,
-    ...reranked,
-  ].slice(0, maxNodes - serendipitySlots);
+  // 8. Combine: reserved capabilities + reranked main pool
+  const deterministic = [...reservedCapabilities, ...reranked].slice(
+    0,
+    maxNodes - serendipitySlots,
+  );
   // Exclude procedural nodes from serendipity — they have reserved slots
   // and shouldn't appear as random wildcard picks.
-  const serendipityPool = scored.filter(
-    (s) => !isCapabilityNode(s.node),
-  );
+  const serendipityPool = scored.filter((s) => !isCapabilityNode(s.node));
   const serendipityPicks = sampleSerendipity(serendipityPool, serendipitySlots);
   // Deduplicate serendipity against deterministic
@@ -626,11 +634,56 @@ export async function loadContextMemory(
     (s) => !deterministicIds.has(s.node.id),
   );
+  // 9. Cross-category dedup: catch topic-level duplicates across reserved
+  //    categories (prospective, upcoming, capabilities) and serendipity.
+  //    Only runs when the combined set is large enough to warrant an LLM call.
+  const CROSS_DEDUP_THRESHOLD = 15;
+  const combined = [...deterministic, ...uniqueSerendipity];
+  let dedupedDeterministic = deterministic;
+  let dedupedSerendipity = uniqueSerendipity;
+  if (combined.length > CROSS_DEDUP_THRESHOLD) {
+    const deduped = await dedupCrossCategory(
+      combined,
+      combined.length, // preserve all non-duplicate nodes
+    );
+    // Re-split into deterministic vs serendipity by checking original membership
+    dedupedDeterministic = deduped.filter((s) =>
+      deterministicIds.has(s.node.id),
+    );
+    dedupedSerendipity = deduped.filter(
+      (s) => !deterministicIds.has(s.node.id),
+    );
+  }
+  const TOP_N = 20;
+  const topCandidates = scored.slice(0, TOP_N).map((s) => ({
+    nodeId: s.node.id,
+    type: s.node.type,
+    score: s.score,
+    semanticSimilarity: s.scoreBreakdown.semanticSimilarity,
+    recencyBoost: s.scoreBreakdown.recencyBoost,
+  }));
   return {
-    nodes: deterministic,
-    serendipityNodes: uniqueSerendipity,
+    nodes: dedupedDeterministic,
+    serendipityNodes: dedupedSerendipity,
     triggeredNodes: allTriggered,
     latencyMs: Date.now() - start,
+    metrics: {
+      semanticHits: pureSemanticHits,
+      mergedCount: scored.length,
+      selectedCount: dedupedDeterministic.length + dedupedSerendipity.length,
+      tier1Count: 0,
+      tier2Count: reservedCapabilities.length,
+      hybridSearchLatencyMs,
+      sparseVectorUsed: false,
+      embeddingProvider,
+      embeddingModel,
+      queryContext: contextQueryText,
+      topCandidates,
+    },
   };
 }
@@ -654,9 +707,12 @@ export interface TurnRetrievalOpts {
 export interface TurnRetrievalResult {
   /** New nodes to inject (not already in context). */
   nodes: ScoredNode[];
+  /** Serendipity picks included in nodes. */
+  serendipityNodes: ScoredNode[];
   /** Triggers that fired this turn. */
   triggeredNodes: TriggeredResult[];
   latencyMs: number;
+  metrics: RetrievalMetrics;
 }
 /**
@@ -674,6 +730,24 @@ export async function retrieveForTurn(
   const now = new Date();
   const nowMs = now.getTime();
+  let embeddingProvider: string | null = null;
+  let embeddingModel: string | null = null;
+  let hybridSearchLatencyMs = 0;
+  const ZERO_METRICS: RetrievalMetrics = {
+    semanticHits: 0,
+    mergedCount: 0,
+    selectedCount: 0,
+    tier1Count: 0,
+    tier2Count: 0,
+    hybridSearchLatencyMs: 0,
+    sparseVectorUsed: false,
+    embeddingProvider: null,
+    embeddingModel: null,
+    queryContext: null,
+    topCandidates: [],
+  };
   // 1. Build query from last exchange
   const queryText = [opts.assistantLastMessage, opts.userLastMessage]
     .filter((m) => m.length > 0)
@@ -685,6 +759,7 @@ export async function retrieveForTurn(
     (b): b is ImageContent => b.type === "image",
   );
   const allCandidateIds = new Map<string, number>(); // nodeId → best score
+  const searchStart = Date.now();
   if (imageBlocks.length > 0) {
     try {
@@ -705,6 +780,10 @@ export async function retrieveForTurn(
           const imgResult = await embedWithRetry(opts.config, [imageInput], {
             signal: opts.signal,
           });
+          if (!embeddingProvider) {
+            embeddingProvider = imgResult.provider;
+            embeddingModel = imgResult.model;
+          }
           const imgVector = imgResult.vectors[0];
           if (imgVector) {
             const imgResults = await searchGraphNodes(imgVector, 40, [
@@ -723,7 +802,20 @@ export async function retrieveForTurn(
   }
   if (queryText.trim().length === 0 && allCandidateIds.size === 0) {
-    return { nodes: [], triggeredNodes: [], latencyMs: Date.now() - start };
+    return {
+      nodes: [],
+      serendipityNodes: [],
+      triggeredNodes: [],
+      latencyMs: Date.now() - start,
+      metrics: {
+        ...ZERO_METRICS,
+        hybridSearchLatencyMs:
+          imageBlocks.length > 0 ? Date.now() - searchStart : 0,
+        embeddingProvider,
+        embeddingModel,
+        queryContext: queryText || null,
+      },
+    };
   }
   // Chunk if too large (8k token ≈ 32k chars conservative estimate)
@@ -764,6 +856,8 @@ export async function retrieveForTurn(
       const embedResults = await embedWithRetry(opts.config, chunks, {
         signal: opts.signal,
       });
+      embeddingProvider = embedResults.provider;
+      embeddingModel = embedResults.model;
       queryEmbeddings = embedResults.vectors;
       const searchPromises = queryEmbeddings.map((vec) =>
@@ -777,14 +871,35 @@ export async function retrieveForTurn(
           allCandidateIds.set(r.nodeId, Math.max(current, r.score));
         }
       }
+      hybridSearchLatencyMs = Date.now() - searchStart;
     } catch (err) {
       log.warn({ err }, "Embedding/search failed for turn retrieval");
       if (allCandidateIds.size === 0) {
-        return { nodes: [], triggeredNodes: [], latencyMs: Date.now() - start };
+        return {
+          nodes: [],
+          serendipityNodes: [],
+          triggeredNodes: [],
+          latencyMs: Date.now() - start,
+          metrics: {
+            ...ZERO_METRICS,
+            hybridSearchLatencyMs: Date.now() - searchStart,
+            embeddingProvider,
+            embeddingModel,
+            queryContext: queryText || null,
+          },
+        };
       }
     }
   }
+  // Capture search latency for image-only searches (text path sets it inside its try block)
+  if (hybridSearchLatencyMs === 0 && allCandidateIds.size > 0) {
+    hybridSearchLatencyMs = Date.now() - searchStart;
+  }
+  // Snapshot pure vector-search results before triggers inflate the set
+  const pureSemanticHits = allCandidateIds.size;
   // 3. Evaluate semantic triggers
   const semanticTriggers = getActiveTriggersByType("semantic", opts.scopeId);
   const triggeredSemantic =
@@ -813,20 +928,36 @@ export async function retrieveForTurn(
   if (newCandidateIds.length === 0) {
     return {
       nodes: [],
+      serendipityNodes: [],
       triggeredNodes: triggeredSemantic,
       latencyMs: Date.now() - start,
+      metrics: {
+        ...ZERO_METRICS,
+        semanticHits: pureSemanticHits,
+        hybridSearchLatencyMs,
+        embeddingProvider,
+        embeddingModel,
+        queryContext: queryText || null,
+      },
     };
   }
   // 5. Hydrate and score
   const nodes = getNodesByIds(newCandidateIds);
   const scored: ScoredNode[] = [];
+  const capabilityCandidates: { node: MemoryNode; sim: number }[] = [];
   for (const node of nodes) {
     if (node.fidelity === "gone") continue;
-    // Procedural nodes (capabilities) have reserved slots at context-load
-    // and shouldn't compete with organic memories in per-turn injection.
-    if (isCapabilityNode(node)) continue;
+    // Capability nodes (auto-seeded skills/CLI) are excluded from the general
+    // scoring pool — they compete in the dedicated procedural reserve below.
+    if (isCapabilityNode(node)) {
+      capabilityCandidates.push({
+        node,
+        sim: allCandidateIds.get(node.id) ?? 0,
+      });
+      continue;
+    }
     const semanticSim = allCandidateIds.get(node.id) ?? 0;
     const effectiveSig = computeEffectiveSignificance(node, nowMs);
@@ -853,156 +984,128 @@ export async function retrieveForTurn(
     );
   }
+  // 5b. Reserve slots for capability nodes (skills/CLI).
+  // Sourced from vector search candidates — only semantically relevant
+  // capabilities compete for reserved slots.
+  const PROCEDURAL_RESERVE = 3;
+  const proceduralCandidates = capabilityCandidates
+    .filter(({ node }) => !opts.tracker.isInContext(node.id))
+    .sort((a, b) => b.sim - a.sim);
+  const seenProcCapIds = new Set<string>();
+  const rankedProcedural = proceduralCandidates
+    .filter(({ node }) => {
+      const match = node.content.match(
+        /^skill:(\S+)\n|^cli:(\S+)\n|^\s*The ".*?" skill \(([^)]+)\)|^\s*The "assistant (\S+)" CLI command/,
+      );
+      const capId = match?.[1] ?? match?.[2] ?? match?.[3] ?? match?.[4];
+      if (capId) {
+        if (seenProcCapIds.has(capId)) return false;
+        seenProcCapIds.add(capId);
+      }
+      return true;
+    })
+    .slice(0, PROCEDURAL_RESERVE);
+  const proceduralScored: ScoredNode[] = rankedProcedural.map(({ node, sim }) =>
+    scoreCandidate(
+      node,
+      {
+        semanticSimilarity: sim,
+        effectiveSignificance: computeEffectiveSignificance(node, nowMs),
+        emotionalIntensity: node.emotionalCharge.intensity,
+        temporalBoost: (computeTemporalBoost(node, now) + 1) / 2,
+        recencyBoost: computeRecencyBoost(node, nowMs),
+        triggerBoost: triggerBoostMap.get(node.id) ?? 0,
+        activationBoost: 0,
+      },
+      PER_TURN_WEIGHTS,
+    ),
+  );
+  const PROCEDURAL_SIM_FLOOR = 0.15;
+  const proceduralInjected = proceduralScored.filter(
+    (s) => s.scoreBreakdown.semanticSimilarity >= PROCEDURAL_SIM_FLOOR,
+  );
+  const proceduralIds = new Set(proceduralInjected.map((s) => s.node.id));
   // Sort and apply threshold — pull a wider pool for dedup, then trim
   scored.sort((a, b) => b.score - a.score);
   const INJECTION_THRESHOLD = 0.3;
-  const PRE_DEDUP_POOL = 40;
-  const MAX_INJECTED = 8;
+  const PRE_DEDUP_POOL = 20;
+  const MAX_INJECTED = 4;
   const pool = scored
     .filter((s) => s.score >= INJECTION_THRESHOLD)
     .slice(0, PRE_DEDUP_POOL);
   // Dedup + rerank with a fast model when the pool is large enough to warrant it
-  const injected =
-    pool.length > MAX_INJECTED
-      ? await dedupForTurn(pool, MAX_INJECTED, opts.userLastMessage)
-      : pool;
-  return {
-    nodes: injected,
-    triggeredNodes: triggeredSemantic,
-    latencyMs: Date.now() - start,
-  };
-}
-// ---------------------------------------------------------------------------
-// Periodic refresh — every N turns, replenish memory context
-// ---------------------------------------------------------------------------
-export interface RefreshOpts {
-  /** Recent turns (last 5-6) concatenated as text. */
-  recentTurnsText: string;
-  scopeId: string;
-  config: AssistantConfig;
-  tracker: InContextTracker;
-  signal?: AbortSignal;
-  /** Max new nodes to inject (default 10). */
-  maxNodes?: number;
-}
-export interface RefreshResult {
-  nodes: ScoredNode[];
-  latencyMs: number;
-}
-/** Default interval between refresh cycles. */
-export const REFRESH_INTERVAL_TURNS = 5;
-/**
- * Periodic context refresh. Runs every N turns to catch memories that
- * the per-turn injection missed due to its high threshold.
- *
- * Uses a wider window (recent 5-6 turns) as the query to capture the
- * evolved conversational vibe. No LLM re-ranking — pure embedding +
- * scoring for speed (~200ms).
- *
- * Also runs after compaction to replenish lost memory context.
- */
-export async function refreshContextMemory(
-  opts: RefreshOpts,
-): Promise<RefreshResult> {
-  const start = Date.now();
-  const now = new Date();
-  const nowMs = now.getTime();
-  const maxNodes = opts.maxNodes ?? 10;
-  if (opts.recentTurnsText.trim().length === 0) {
-    return { nodes: [], latencyMs: Date.now() - start };
-  }
-  // 1. Embed recent turns window
-  const queryText =
-    opts.recentTurnsText.length > 6000
-      ? opts.recentTurnsText.slice(-6000)
-      : opts.recentTurnsText;
-  let queryVector: number[] | null = null;
-  try {
-    const result = await embedWithRetry(opts.config, [queryText], {
-      signal: opts.signal,
-    });
-    queryVector = result.vectors[0] ?? null;
-  } catch (err) {
-    log.warn({ err }, "Embedding failed for context refresh");
-    return { nodes: [], latencyMs: Date.now() - start };
-  }
-  if (!queryVector) {
-    return { nodes: [], latencyMs: Date.now() - start };
+  let injected: ScoredNode[];
+  let llmDedupApplied = false;
+  if (pool.length > MAX_INJECTED) {
+    const result = await dedupForTurn(pool, MAX_INJECTED, opts.userLastMessage);
+    injected = result.nodes;
+    llmDedupApplied = result.llmApplied;
+  } else {
+    injected = pool;
   }
-  // 2. Search — cast a wider net than per-turn
-  let candidates: Array<{ nodeId: string; score: number }>;
-  try {
-    candidates = await searchGraphNodes(queryVector, maxNodes * 3, [
-      opts.scopeId,
+  // Remove procedural-reserved nodes from general set to avoid double-counting
+  const generalInjected = injected.filter((s) => !proceduralIds.has(s.node.id));
+  // Backfill vacated general slots from the remaining pool so we always
+  // return up to MAX_INJECTED general memories when eligible candidates exist.
+  // Only skip backfill when LLM dedup genuinely ran — it intentionally rejected
+  // items as duplicates/irrelevant. When dedupForTurn fell back to a plain
+  // top-N slice (no provider, tool call failure), backfill is still appropriate.
+  if (generalInjected.length < MAX_INJECTED && !llmDedupApplied) {
+    const usedIds = new Set([
+      ...generalInjected.map((s) => s.node.id),
+      ...proceduralIds,
     ]);
-  } catch (err) {
-    log.warn({ err }, "Qdrant search failed for context refresh");
-    return { nodes: [], latencyMs: Date.now() - start };
+    const backfillCandidates = pool.filter((s) => !usedIds.has(s.node.id));
+    const needed = MAX_INJECTED - generalInjected.length;
+    for (let i = 0; i < Math.min(needed, backfillCandidates.length); i++) {
+      generalInjected.push(backfillCandidates[i]);
+    }
   }
-  // 3. Filter to nodes NOT already in context
-  const newCandidates = candidates.filter(
-    (c) => !opts.tracker.isInContext(c.nodeId),
-  );
+  const allDeterministic = [...generalInjected, ...proceduralInjected];
+  const deterministicIds = new Set(allDeterministic.map((n) => n.node.id));
-  if (newCandidates.length === 0) {
-    return { nodes: [], latencyMs: Date.now() - start };
-  }
-  // 4. Hydrate and score
-  const nodes = getNodesByIds(newCandidates.map((c) => c.nodeId));
-  const candidateScoreMap = new Map(
-    newCandidates.map((c) => [c.nodeId, c.score]),
+  // Reserve 1 serendipity slot from scored candidates not in the deterministic set
+  const serendipityPool = scored.filter(
+    (s) => s.score >= INJECTION_THRESHOLD && !deterministicIds.has(s.node.id),
   );
-  const scored: ScoredNode[] = [];
-  for (const node of nodes) {
-    if (node.fidelity === "gone") continue;
-    if (isCapabilityNode(node)) continue;
-    const semanticSim = candidateScoreMap.get(node.id) ?? 0;
-    const effectiveSig = computeEffectiveSignificance(node, nowMs);
-    const temporal = computeTemporalBoost(node, now);
-    const recency = computeRecencyBoost(node, nowMs);
-    scored.push(
-      scoreCandidate(
-        node,
-        {
-          semanticSimilarity: semanticSim,
-          effectiveSignificance: effectiveSig,
-          emotionalIntensity: node.emotionalCharge.intensity,
-          temporalBoost: (temporal + 1) / 2,
-          recencyBoost: recency,
-          triggerBoost: 0,
-          activationBoost: 0,
-        },
-        PER_TURN_WEIGHTS,
-      ),
-    );
-  }
-  // 5. Return top N — lower threshold than per-turn since this is a periodic refresh
-  scored.sort((a, b) => b.score - a.score);
-  const REFRESH_THRESHOLD = 0.15;
-  const refreshed = scored
-    .filter((s) => s.score >= REFRESH_THRESHOLD)
-    .slice(0, maxNodes);
+  const serendipityPicks = sampleSerendipity(serendipityPool, 1);
+  const allInjected = [...allDeterministic, ...serendipityPicks];
+  const TOP_N = 20;
+  const topCandidates = scored.slice(0, TOP_N).map((s) => ({
+    nodeId: s.node.id,
+    type: s.node.type,
+    score: s.score,
+    semanticSimilarity: s.scoreBreakdown.semanticSimilarity,
+    recencyBoost: s.scoreBreakdown.recencyBoost,
+  }));
   return {
-    nodes: refreshed,
+    nodes: allInjected,
+    serendipityNodes: serendipityPicks,
+    triggeredNodes: triggeredSemantic,
     latencyMs: Date.now() - start,
+    metrics: {
+      semanticHits: pureSemanticHits,
+      mergedCount: scored.length,
+      selectedCount: allInjected.length,
+      tier1Count: 0,
+      tier2Count: 0,
+      hybridSearchLatencyMs,
+      sparseVectorUsed: false,
+      embeddingProvider,
+      embeddingModel,
+      queryContext: queryText || null,
+      topCandidates,
+    },
   };
 }