npm - @vellumai/assistant - Versions diffs - 0.4.49 → 0.4.50 - Mend

@vellumai/assistant 0.4.49 → 0.4.50

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (239) hide show

package/ARCHITECTURE.md +24 -33
package/README.md +3 -3
package/docs/architecture/memory.md +180 -119
package/package.json +2 -2
package/src/__tests__/agent-loop.test.ts +3 -1
package/src/__tests__/anthropic-provider.test.ts +114 -23
package/src/__tests__/approval-cascade.test.ts +1 -15
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-feature-flag-guard.test.ts +0 -23
package/src/__tests__/canonical-guardian-store.test.ts +95 -0
package/src/__tests__/checker.test.ts +13 -0
package/src/__tests__/config-schema.test.ts +1 -68
package/src/__tests__/context-memory-e2e.test.ts +11 -100
package/src/__tests__/conversation-routes-guardian-reply.test.ts +8 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-security-e2e.test.ts +1 -0
package/src/__tests__/credential-vault-unit.test.ts +4 -0
package/src/__tests__/credential-vault.test.ts +13 -1
package/src/__tests__/cu-unified-flow.test.ts +532 -0
package/src/__tests__/date-context.test.ts +93 -77
package/src/__tests__/deterministic-verification-control-plane.test.ts +64 -0
package/src/__tests__/guardian-routing-invariants.test.ts +93 -0
package/src/__tests__/history-repair.test.ts +245 -0
package/src/__tests__/host-cu-proxy.test.ts +165 -3
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/invite-redemption-service.test.ts +65 -1
package/src/__tests__/keychain-broker-client.test.ts +4 -4
package/src/__tests__/memory-context-benchmark.benchmark.test.ts +56 -18
package/src/__tests__/memory-lifecycle-e2e.test.ts +244 -387
package/src/__tests__/memory-recall-quality.test.ts +244 -407
package/src/__tests__/memory-regressions.experimental.test.ts +126 -101
package/src/__tests__/memory-regressions.test.ts +477 -2841
package/src/__tests__/memory-retrieval.benchmark.test.ts +33 -150
package/src/__tests__/memory-upsert-concurrency.test.ts +5 -244
package/src/__tests__/mime-builder.test.ts +28 -0
package/src/__tests__/native-web-search.test.ts +1 -0
package/src/__tests__/oauth-cli.test.ts +572 -5
package/src/__tests__/oauth-store.test.ts +120 -6
package/src/__tests__/qdrant-collection-migration.test.ts +53 -8
package/src/__tests__/registry.test.ts +0 -1
package/src/__tests__/relay-server.test.ts +46 -1
package/src/__tests__/schedule-tools.test.ts +32 -0
package/src/__tests__/script-proxy-certs.test.ts +1 -1
package/src/__tests__/secret-onetime-send.test.ts +1 -0
package/src/__tests__/secure-keys.test.ts +7 -2
package/src/__tests__/send-endpoint-busy.test.ts +3 -0
package/src/__tests__/session-abort-tool-results.test.ts +1 -14
package/src/__tests__/session-agent-loop-overflow.test.ts +1583 -0
package/src/__tests__/session-agent-loop.test.ts +19 -15
package/src/__tests__/session-confirmation-signals.test.ts +1 -15
package/src/__tests__/session-error.test.ts +124 -2
package/src/__tests__/session-history-web-search.test.ts +918 -0
package/src/__tests__/session-pre-run-repair.test.ts +1 -14
package/src/__tests__/session-provider-retry-repair.test.ts +25 -28
package/src/__tests__/session-queue.test.ts +37 -27
package/src/__tests__/session-runtime-assembly.test.ts +54 -0
package/src/__tests__/session-slash-known.test.ts +1 -15
package/src/__tests__/session-slash-queue.test.ts +1 -15
package/src/__tests__/session-slash-unknown.test.ts +1 -15
package/src/__tests__/session-workspace-cache-state.test.ts +3 -33
package/src/__tests__/session-workspace-injection.test.ts +3 -37
package/src/__tests__/session-workspace-tool-tracking.test.ts +3 -37
package/src/__tests__/skills-install-extract.test.ts +93 -0
package/src/__tests__/skillssh-registry.test.ts +451 -0
package/src/__tests__/trust-store.test.ts +15 -0
package/src/__tests__/voice-invite-redemption.test.ts +32 -1
package/src/agent/ax-tree-compaction.test.ts +51 -0
package/src/agent/loop.ts +39 -12
package/src/approvals/AGENTS.md +1 -1
package/src/approvals/guardian-request-resolvers.ts +14 -2
package/src/bundler/compiler-tools.ts +66 -2
package/src/calls/call-domain.ts +132 -0
package/src/calls/call-store.ts +6 -0
package/src/calls/relay-server.ts +43 -5
package/src/calls/relay-setup-router.ts +17 -1
package/src/calls/twilio-config.ts +1 -1
package/src/calls/types.ts +3 -1
package/src/cli/commands/doctor.ts +4 -3
package/src/cli/commands/mcp.ts +46 -59
package/src/cli/commands/memory.ts +16 -165
package/src/cli/commands/oauth/apps.ts +31 -2
package/src/cli/commands/oauth/connections.ts +431 -97
package/src/cli/commands/oauth/providers.ts +15 -1
package/src/cli/commands/sessions.ts +5 -2
package/src/cli/commands/skills.ts +173 -1
package/src/cli/http-client.ts +0 -20
package/src/cli/main-screen.tsx +2 -2
package/src/cli/program.ts +5 -6
package/src/cli.ts +4 -10
package/src/config/bundled-skills/computer-use/TOOLS.json +1 -1
package/src/config/bundled-skills/computer-use/tools/computer-use-observe.ts +12 -0
package/src/config/bundled-tool-registry.ts +2 -5
package/src/config/schema.ts +1 -12
package/src/config/schemas/memory-lifecycle.ts +0 -9
package/src/config/schemas/memory-processing.ts +0 -180
package/src/config/schemas/memory-retrieval.ts +32 -104
package/src/config/schemas/memory.ts +0 -10
package/src/config/types.ts +0 -4
package/src/context/window-manager.ts +4 -1
package/src/daemon/config-watcher.ts +61 -3
package/src/daemon/daemon-control.ts +1 -1
package/src/daemon/date-context.ts +114 -31
package/src/daemon/handlers/sessions.ts +18 -13
package/src/daemon/handlers/skills.ts +20 -1
package/src/daemon/history-repair.ts +72 -8
package/src/daemon/host-cu-proxy.ts +55 -26
package/src/daemon/lifecycle.ts +31 -3
package/src/daemon/mcp-reload-service.ts +2 -2
package/src/daemon/message-types/computer-use.ts +1 -12
package/src/daemon/message-types/memory.ts +4 -16
package/src/daemon/message-types/messages.ts +1 -0
package/src/daemon/message-types/sessions.ts +4 -0
package/src/daemon/server.ts +12 -1
package/src/daemon/session-agent-loop-handlers.ts +38 -0
package/src/daemon/session-agent-loop.ts +334 -48
package/src/daemon/session-error.ts +89 -6
package/src/daemon/session-history.ts +17 -7
package/src/daemon/session-media-retry.ts +6 -2
package/src/daemon/session-memory.ts +69 -149
package/src/daemon/session-process.ts +10 -1
package/src/daemon/session-runtime-assembly.ts +49 -19
package/src/daemon/session-surfaces.ts +4 -1
package/src/daemon/session-tool-setup.ts +7 -1
package/src/daemon/session.ts +12 -2
package/src/instrument.ts +61 -1
package/src/memory/admin.ts +2 -191
package/src/memory/canonical-guardian-store.ts +38 -2
package/src/memory/conversation-crud.ts +0 -33
package/src/memory/conversation-queries.ts +22 -3
package/src/memory/db-init.ts +28 -0
package/src/memory/embedding-backend.ts +84 -8
package/src/memory/embedding-types.ts +9 -1
package/src/memory/indexer.ts +7 -46
package/src/memory/items-extractor.ts +274 -76
package/src/memory/job-handlers/backfill.ts +2 -127
package/src/memory/job-handlers/cleanup.ts +2 -16
package/src/memory/job-handlers/extraction.ts +2 -138
package/src/memory/job-handlers/index-maintenance.ts +1 -6
package/src/memory/job-handlers/summarization.ts +3 -148
package/src/memory/job-utils.ts +21 -59
package/src/memory/jobs-store.ts +1 -159
package/src/memory/jobs-worker.ts +9 -52
package/src/memory/migrations/104-core-indexes.ts +3 -3
package/src/memory/migrations/149-oauth-tables.ts +2 -0
package/src/memory/migrations/150-oauth-apps-client-secret-path.ts +98 -0
package/src/memory/migrations/151-oauth-providers-ping-url.ts +11 -0
package/src/memory/migrations/152-memory-item-supersession.ts +44 -0
package/src/memory/migrations/153-drop-entity-tables.ts +15 -0
package/src/memory/migrations/154-drop-fts.ts +20 -0
package/src/memory/migrations/155-drop-conflicts.ts +7 -0
package/src/memory/migrations/156-call-session-invite-metadata.ts +24 -0
package/src/memory/migrations/index.ts +7 -0
package/src/memory/qdrant-client.ts +148 -51
package/src/memory/raw-query.ts +1 -1
package/src/memory/retriever.test.ts +294 -273
package/src/memory/retriever.ts +421 -645
package/src/memory/schema/calls.ts +2 -0
package/src/memory/schema/memory-core.ts +3 -48
package/src/memory/schema/oauth.ts +2 -0
package/src/memory/search/formatting.ts +263 -176
package/src/memory/search/lexical.ts +1 -254
package/src/memory/search/ranking.ts +0 -455
package/src/memory/search/semantic.ts +100 -14
package/src/memory/search/staleness.ts +47 -0
package/src/memory/search/tier-classifier.ts +21 -0
package/src/memory/search/types.ts +15 -77
package/src/memory/task-memory-cleanup.ts +4 -6
package/src/messaging/providers/gmail/mime-builder.ts +17 -7
package/src/oauth/byo-connection.test.ts +8 -1
package/src/oauth/oauth-store.ts +113 -27
package/src/oauth/seed-providers.ts +6 -0
package/src/oauth/token-persistence.ts +11 -3
package/src/permissions/defaults.ts +1 -0
package/src/permissions/trust-store.ts +23 -1
package/src/playbooks/playbook-compiler.ts +1 -1
package/src/prompts/system-prompt.ts +18 -2
package/src/providers/anthropic/client.ts +56 -126
package/src/providers/types.ts +7 -1
package/src/runtime/AGENTS.md +9 -0
package/src/runtime/auth/route-policy.ts +6 -3
package/src/runtime/guardian-reply-router.ts +24 -22
package/src/runtime/http-server.ts +2 -2
package/src/runtime/invite-redemption-service.ts +19 -1
package/src/runtime/invite-service.ts +25 -0
package/src/runtime/pending-interactions.ts +2 -2
package/src/runtime/routes/brain-graph-routes.ts +10 -90
package/src/runtime/routes/conversation-routes.ts +9 -1
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +21 -12
package/src/runtime/routes/memory-item-routes.test.ts +754 -0
package/src/runtime/routes/memory-item-routes.ts +503 -0
package/src/runtime/routes/session-management-routes.ts +3 -3
package/src/runtime/routes/settings-routes.ts +2 -2
package/src/runtime/routes/trust-rules-routes.ts +14 -0
package/src/runtime/routes/workspace-routes.ts +2 -1
package/src/security/keychain-broker-client.ts +17 -4
package/src/security/secure-keys.ts +25 -3
package/src/security/token-manager.ts +36 -36
package/src/skills/catalog-install.ts +74 -18
package/src/skills/skillssh-registry.ts +503 -0
package/src/tools/assets/search.ts +5 -1
package/src/tools/computer-use/definitions.ts +0 -10
package/src/tools/computer-use/registry.ts +1 -1
package/src/tools/credentials/vault.ts +1 -3
package/src/tools/memory/definitions.ts +4 -13
package/src/tools/memory/handlers.test.ts +83 -103
package/src/tools/memory/handlers.ts +50 -85
package/src/tools/schedule/create.ts +8 -1
package/src/tools/schedule/update.ts +8 -1
package/src/tools/skills/load.ts +25 -2
package/src/__tests__/clarification-resolver.test.ts +0 -193
package/src/__tests__/conflict-intent-tokenization.test.ts +0 -160
package/src/__tests__/conflict-policy.test.ts +0 -269
package/src/__tests__/conflict-store.test.ts +0 -372
package/src/__tests__/contradiction-checker.test.ts +0 -361
package/src/__tests__/entity-extractor.test.ts +0 -211
package/src/__tests__/entity-search.test.ts +0 -1117
package/src/__tests__/profile-compiler.test.ts +0 -392
package/src/__tests__/session-conflict-gate.test.ts +0 -1228
package/src/__tests__/session-profile-injection.test.ts +0 -557
package/src/config/bundled-skills/knowledge-graph/SKILL.md +0 -25
package/src/config/bundled-skills/knowledge-graph/TOOLS.json +0 -66
package/src/config/bundled-skills/knowledge-graph/tools/graph-query.ts +0 -211
package/src/daemon/session-conflict-gate.ts +0 -167
package/src/daemon/session-dynamic-profile.ts +0 -77
package/src/memory/clarification-resolver.ts +0 -417
package/src/memory/conflict-intent.ts +0 -205
package/src/memory/conflict-policy.ts +0 -127
package/src/memory/conflict-store.ts +0 -410
package/src/memory/contradiction-checker.ts +0 -508
package/src/memory/entity-extractor.ts +0 -535
package/src/memory/format-recall.ts +0 -47
package/src/memory/fts-reconciler.ts +0 -165
package/src/memory/job-handlers/conflict.ts +0 -200
package/src/memory/profile-compiler.ts +0 -195
package/src/memory/recall-cache.ts +0 -117
package/src/memory/search/entity.ts +0 -535
package/src/memory/search/query-expansion.test.ts +0 -70
package/src/memory/search/query-expansion.ts +0 -118
package/src/runtime/routes/mcp-routes.ts +0 -20

package/src/memory/retriever.test.ts CHANGED Viewed

@@ -1,10 +1,9 @@
 /**
- * Tests for graceful embedding degradation in the memory retrieval pipeline.
+ * Tests for the memory retrieval pipeline.
  *
- * Verifies that when semantic search subsystems (Qdrant, embedding provider)
- * are unavailable, the retriever falls back to lexical/recency/direct sources
- * with boosted limits, applies query expansion, and reports structured
- * degradation status in result metadata.
+ * Covers: hybrid search → tier classification → staleness → injection,
+ * empty results → no injection, superseded items filtered out,
+ * staleness demotion, budget allocation, and degradation scenarios.
  */
 import { mkdtempSync, rmSync } from "node:fs";
 import { tmpdir } from "node:os";
@@ -19,7 +18,7 @@ import {
   test,
 } from "bun:test";
-const testDir = mkdtempSync(join(tmpdir(), "memory-retriever-degrade-"));
+const testDir = mkdtempSync(join(tmpdir(), "memory-retriever-"));
 mock.module("../util/platform.js", () => ({
   getDataDir: () => testDir,
@@ -57,6 +56,7 @@ mock.module("../memory/embedding-local.js", () => ({
 mock.module("../memory/qdrant-client.js", () => ({
   getQdrantClient: () => ({
     searchWithFilter: async () => [],
+    hybridSearch: async () => [],
     upsertPoints: async () => {},
     deletePoints: async () => {},
   }),
@@ -93,8 +93,11 @@ import {
   _resetQdrantBreaker,
   isQdrantBreakerOpen,
 } from "../memory/qdrant-circuit-breaker.js";
-import { bumpMemoryVersion } from "../memory/recall-cache.js";
-import { buildMemoryRecall } from "../memory/retriever.js";
+import {
+  buildMemoryRecall,
+  injectMemoryRecallAsSeparateMessage,
+  stripMemoryRecallMessages,
+} from "../memory/retriever.js";
 import {
   conversations,
   memoryItems,
@@ -219,7 +222,7 @@ function insertItemSource(
 function seedMemory() {
   const db = getDb();
   const now = Date.now();
-  const convId = "conv-degrade-test";
+  const convId = "conv-test";
   insertConversation(db, convId, now - 60_000);
   insertMessage(
@@ -272,7 +275,7 @@ function seedMemory() {
 // Suite
 // ---------------------------------------------------------------------------
-describe("Memory Retriever Degradation", () => {
+describe("Memory Retriever Pipeline", () => {
   beforeAll(() => {
     initializeDb();
   });
@@ -282,12 +285,10 @@ describe("Memory Retriever Degradation", () => {
     db.run("DELETE FROM memory_item_sources");
     db.run("DELETE FROM memory_items");
     db.run("DELETE FROM memory_segments");
-    db.run("DELETE FROM memory_segment_fts");
     db.run("DELETE FROM messages");
     db.run("DELETE FROM conversations");
     _resetQdrantBreaker();
     clearEmbeddingBackendCache();
-    bumpMemoryVersion();
   });
   afterAll(() => {
@@ -296,190 +297,207 @@ describe("Memory Retriever Degradation", () => {
   });
   // -----------------------------------------------------------------------
-  // Non-degraded baseline
+  // Hybrid search → tier classification → injection
   // -----------------------------------------------------------------------
-  test("non-degraded baseline: returns results with degraded=false when all systems available", async () => {
+  test("baseline: pipeline completes non-degraded with mock Qdrant returning empty", async () => {
     seedMemory();
     const result = await buildMemoryRecall(
       "API design",
-      "conv-degrade-test",
+      "conv-test",
       TEST_CONFIG,
     );
     expect(result.enabled).toBe(true);
     expect(result.degraded).toBe(false);
     expect(result.degradation).toBeUndefined();
-    // Lexical search should find matches
-    expect(result.lexicalHits).toBeGreaterThan(0);
-    // Should have selected some candidates
-    expect(result.selectedCount).toBeGreaterThan(0);
-    expect(result.injectedText.length).toBeGreaterThan(0);
+    // With mock Qdrant returning empty results and recency-only candidates
+    // scoring below tier thresholds, no candidates are selected.
+    // The pipeline still completes successfully with tier metadata.
+    expect(result.tier1Count).toBeDefined();
+    expect(result.tier2Count).toBeDefined();
+    expect(result.hybridSearchMs).toBeDefined();
+    // Recency search finds candidates even though they don't pass tier classification
+    expect(result.recencyHits).toBeGreaterThan(0);
+    expect(result.mergedCount).toBeGreaterThan(0);
   });
   // -----------------------------------------------------------------------
-  // Qdrant circuit breaker open
+  // Empty results → no injection
   // -----------------------------------------------------------------------
-  test("Qdrant unavailable: skips semantic search and boosts lexical limits", async () => {
-    seedMemory();
-    // Force the Qdrant circuit breaker open by importing and manipulating it.
-    // We need to trip it by recording enough failures.
-    const { withQdrantBreaker } =
-      await import("../memory/qdrant-circuit-breaker.js");
-    for (let i = 0; i < 5; i++) {
-      try {
-        await withQdrantBreaker(async () => {
-          throw new Error("simulated qdrant failure");
-        });
-      } catch {
-        // expected
-      }
-    }
-    expect(isQdrantBreakerOpen()).toBe(true);
+  test("empty results: no injection when no memory content exists", async () => {
+    // Don't seed any memory
     const result = await buildMemoryRecall(
-      "API design",
-      "conv-degrade-test",
+      "nonexistent topic",
+      "conv-empty",
       TEST_CONFIG,
     );
     expect(result.enabled).toBe(true);
-    // Semantic search should be skipped entirely
-    expect(result.semanticHits).toBe(0);
-    // Lexical search should still work (boosted limits)
-    expect(result.lexicalHits).toBeGreaterThan(0);
-    // Results should still be returned despite no semantic
-    expect(result.selectedCount).toBeGreaterThan(0);
-    expect(result.injectedText.length).toBeGreaterThan(0);
+    expect(result.selectedCount).toBe(0);
+    expect(result.injectedText).toBe("");
+    expect(result.mergedCount).toBe(0);
   });
   // -----------------------------------------------------------------------
-  // Embedding provider down
+  // Memory disabled
   // -----------------------------------------------------------------------
-  test("embedding provider down: falls back to lexical-only when embeddings not required", async () => {
-    seedMemory();
-    // Config with no embedding provider available (no API keys, auto mode)
-    const noEmbedConfig: AssistantConfig = {
+  test("disabled: returns enabled=false when memory is disabled", async () => {
+    const disabledConfig: AssistantConfig = {
       ...TEST_CONFIG,
-      apiKeys: {
-        ...TEST_CONFIG.apiKeys,
-        openai: "",
-        gemini: "",
-        ollama: "",
-      },
       memory: {
         ...TEST_CONFIG.memory,
-        embeddings: {
-          ...TEST_CONFIG.memory.embeddings,
-          provider: "openai",
-          required: false,
-        },
+        enabled: false,
       },
     };
     const result = await buildMemoryRecall(
-      "API design",
-      "conv-degrade-test",
-      noEmbedConfig,
+      "test query",
+      "conv-test",
+      disabledConfig,
     );
-    expect(result.enabled).toBe(true);
-    // With no embedding provider, semantic search should be skipped
-    expect(result.semanticHits).toBe(0);
-    // Lexical search should still produce results
-    expect(result.lexicalHits).toBeGreaterThan(0);
-    expect(result.selectedCount).toBeGreaterThan(0);
+    expect(result.enabled).toBe(false);
+    expect(result.reason).toBe("memory.disabled");
   });
-  test("embedding provider down: returns degraded with structured status when embeddings required", async () => {
-    seedMemory();
+  // -----------------------------------------------------------------------
+  // Superseded items filtered out
+  // -----------------------------------------------------------------------
-    const requiredEmbedConfig: AssistantConfig = {
-      ...TEST_CONFIG,
-      apiKeys: {
-        ...TEST_CONFIG.apiKeys,
-        openai: "",
-        gemini: "",
-        ollama: "",
-      },
-      memory: {
-        ...TEST_CONFIG.memory,
-        embeddings: {
-          ...TEST_CONFIG.memory.embeddings,
-          provider: "openai",
-          required: true,
-        },
-      },
-    };
+  test("superseded items are not included in results", async () => {
+    const db = getDb();
+    const now = Date.now();
+    const convId = "conv-superseded";
+    insertConversation(db, convId, now - 60_000);
+    insertMessage(db, "msg-s1", convId, "user", "test superseded", now - 50_000);
+    insertSegment(
+      db,
+      "seg-s1",
+      "msg-s1",
+      convId,
+      "user",
+      "test superseded content",
+      now - 50_000,
+    );
+    // Insert an active item and a superseded item
+    insertItem(db, {
+      id: "item-active",
+      kind: "fact",
+      subject: "test",
+      statement: "Active fact about testing",
+      status: "active",
+      firstSeenAt: now - 30_000,
+    });
+    insertItem(db, {
+      id: "item-superseded",
+      kind: "fact",
+      subject: "test",
+      statement: "Old fact that was superseded",
+      status: "superseded",
+      firstSeenAt: now - 30_000,
+    });
     const result = await buildMemoryRecall(
-      "API design",
-      "conv-degrade-test",
-      requiredEmbedConfig,
+      "test superseded",
+      convId,
+      TEST_CONFIG,
     );
+    // The injected text should not contain the superseded item statement
+    if (result.injectedText.length > 0) {
+      expect(result.injectedText).not.toContain("Old fact that was superseded");
+    }
+  });
+  // -----------------------------------------------------------------------
+  // Staleness demotion (very_stale tier 1 → tier 2)
+  // -----------------------------------------------------------------------
+  test("staleness: very old items get demoted from tier 1 to tier 2", async () => {
+    const db = getDb();
+    const now = Date.now();
+    const convId = "conv-stale";
+    const MS_PER_DAY = 86_400_000;
+    insertConversation(db, convId, now - MS_PER_DAY * 200);
+    // Create a message from 200 days ago to serve as recency source
+    insertMessage(
+      db,
+      "msg-old",
+      convId,
+      "user",
+      "ancient discussion about TypeScript",
+      now - MS_PER_DAY * 200,
+    );
+    insertSegment(
+      db,
+      "seg-old",
+      "msg-old",
+      convId,
+      "user",
+      "ancient discussion about TypeScript patterns",
+      now - MS_PER_DAY * 200,
+    );
+    // Insert a very old item (200 days) — should be marked as very_stale
+    insertItem(db, {
+      id: "item-old",
+      kind: "fact",
+      subject: "TypeScript",
+      statement: "User uses TypeScript for all projects",
+      firstSeenAt: now - MS_PER_DAY * 200,
+    });
+    insertItemSource(db, "item-old", "msg-old", now - MS_PER_DAY * 200);
+    const result = await buildMemoryRecall(
+      "TypeScript patterns",
+      convId,
+      TEST_CONFIG,
+    );
+    // The pipeline should still return results (just potentially in tier 2)
     expect(result.enabled).toBe(true);
-    expect(result.degraded).toBe(true);
-    // Structured degradation status should be present
-    expect(result.degradation).toBeDefined();
-    expect(result.degradation!.semanticUnavailable).toBe(true);
-    expect(result.degradation!.reason).toBe("embedding_provider_down");
-    expect(result.degradation!.fallbackSources).toContain("lexical");
-    expect(result.degradation!.fallbackSources).toContain("recency");
-    expect(result.degradation!.fallbackSources).toContain("direct_item");
+    // Very old items should still appear but may be in tier 2 after demotion
+    expect(result.tier1Count).toBeDefined();
+    expect(result.tier2Count).toBeDefined();
   });
   // -----------------------------------------------------------------------
-  // Query expansion in degraded mode
+  // Budget allocation (tier 1 priority)
   // -----------------------------------------------------------------------
-  test("query expansion: conversational query gets expanded to keywords when semantic unavailable", async () => {
+  test("budget: respects maxInjectTokens override", async () => {
     seedMemory();
-    // Force degraded mode via circuit breaker
-    const { withQdrantBreaker } =
-      await import("../memory/qdrant-circuit-breaker.js");
-    for (let i = 0; i < 5; i++) {
-      try {
-        await withQdrantBreaker(async () => {
-          throw new Error("simulated qdrant failure");
-        });
-      } catch {
-        // expected
-      }
-    }
-    // Use a conversational query full of stop words — query expansion should
-    // strip them to meaningful keywords for better FTS recall.
+    // Use a very small token budget
     const result = await buildMemoryRecall(
-      "what did we discuss about the API design?",
-      "conv-degrade-test",
+      "API design",
+      "conv-test",
       TEST_CONFIG,
+      { maxInjectTokensOverride: 10 },
     );
     expect(result.enabled).toBe(true);
-    expect(result.semanticHits).toBe(0);
-    // The expanded query ("discuss", "API", "design") should match our seeded
-    // segments and items containing those terms.
-    expect(result.lexicalHits).toBeGreaterThan(0);
-    expect(result.selectedCount).toBeGreaterThan(0);
-    // Verify the injected text contains content from our seeded data
-    expect(result.injectedText).toContain("API");
+    // With a 10-token budget, most content should be truncated
+    expect(result.injectedTokens).toBeLessThanOrEqual(10);
   });
   // -----------------------------------------------------------------------
-  // Degradation status structure
+  // Degradation: Qdrant circuit breaker open
   // -----------------------------------------------------------------------
-  test("degradation status: includes expected fields for qdrant_unavailable", async () => {
+  test("Qdrant unavailable: pipeline completes with recency fallback", async () => {
     seedMemory();
-    // Trip the circuit breaker
+    // Force the Qdrant circuit breaker open
     const { withQdrantBreaker } =
       await import("../memory/qdrant-circuit-breaker.js");
     for (let i = 0; i < 5; i++) {
@@ -491,49 +509,31 @@ describe("Memory Retriever Degradation", () => {
         // expected
       }
     }
-    // Disable early termination so the pipeline always reaches the
-    // semantic search phase, where the open breaker triggers degradation.
-    const configNoET: AssistantConfig = {
-      ...TEST_CONFIG,
-      memory: {
-        ...TEST_CONFIG.memory,
-        retrieval: {
-          ...TEST_CONFIG.memory.retrieval,
-          earlyTermination: {
-            ...TEST_CONFIG.memory.retrieval.earlyTermination,
-            enabled: false,
-          },
-        },
-      },
-    };
+    expect(isQdrantBreakerOpen()).toBe(true);
     const result = await buildMemoryRecall(
       "API design",
-      "conv-degrade-test",
-      configNoET,
+      "conv-test",
+      TEST_CONFIG,
     );
-    // The local stub produces a non-null zero vector, so semanticSearch()
-    // is still attempted. The open breaker causes withQdrantBreaker() to
-    // throw, which sets semanticSearchFailed = true and propagates into
-    // the degradation field with reason 'qdrant_unavailable'.
     expect(result.enabled).toBe(true);
+    // Semantic/hybrid search should be skipped
     expect(result.semanticHits).toBe(0);
-    // Results are still returned from lexical sources
-    expect(result.selectedCount).toBeGreaterThan(0);
-    // Verify structured degradation metadata
-    expect(result.degradation).toBeDefined();
-    expect(result.degradation!.reason).toBe("qdrant_unavailable");
-    expect(result.degradation!.semanticUnavailable).toBe(true);
-    expect(result.degradation!.fallbackSources).toBeInstanceOf(Array);
-    expect(result.degradation!.fallbackSources.length).toBeGreaterThan(0);
+    // Recency search finds candidates (but they may not pass tier thresholds
+    // since recency-only candidates have no semantic score component)
+    expect(result.recencyHits).toBeGreaterThan(0);
+    expect(result.mergedCount).toBeGreaterThan(0);
   });
-  test("degradation status: entity fallback included when entity search enabled", async () => {
+  // -----------------------------------------------------------------------
+  // Degradation: embedding provider down
+  // -----------------------------------------------------------------------
+  test("embedding provider down: returns degraded when embeddings required", async () => {
     seedMemory();
-    const entityConfig: AssistantConfig = {
+    const requiredEmbedConfig: AssistantConfig = {
       ...TEST_CONFIG,
       apiKeys: {
         ...TEST_CONFIG.apiKeys,
@@ -543,10 +543,6 @@ describe("Memory Retriever Degradation", () => {
       },
       memory: {
         ...TEST_CONFIG.memory,
-        entity: {
-          ...TEST_CONFIG.memory.entity,
-          enabled: true,
-        },
         embeddings: {
           ...TEST_CONFIG.memory.embeddings,
           provider: "openai",
@@ -557,57 +553,150 @@ describe("Memory Retriever Degradation", () => {
     const result = await buildMemoryRecall(
       "API design",
-      "conv-degrade-test",
-      entityConfig,
+      "conv-test",
+      requiredEmbedConfig,
     );
+    expect(result.enabled).toBe(true);
+    expect(result.degraded).toBe(true);
     expect(result.degradation).toBeDefined();
-    expect(result.degradation!.fallbackSources).toContain("entity");
+    expect(result.degradation!.semanticUnavailable).toBe(true);
+    expect(result.degradation!.reason).toBe("embedding_provider_down");
+    expect(result.degradation!.fallbackSources).toContain("recency");
   });
-  test("degradation status: entity fallback excluded when entity search disabled", async () => {
+  // -----------------------------------------------------------------------
+  // Signal abort
+  // -----------------------------------------------------------------------
+  test("abort: returns early when signal is aborted", async () => {
     seedMemory();
+    const controller = new AbortController();
+    controller.abort();
-    const noEntityConfig: AssistantConfig = {
-      ...TEST_CONFIG,
-      apiKeys: {
-        ...TEST_CONFIG.apiKeys,
-        openai: "",
-        gemini: "",
-        ollama: "",
+    const result = await buildMemoryRecall(
+      "API design",
+      "conv-test",
+      TEST_CONFIG,
+      { signal: controller.signal },
+    );
+    expect(result.enabled).toBe(true);
+    expect(result.reason).toBe("memory.aborted");
+    expect(result.injectedText).toBe("");
+  });
+  // -----------------------------------------------------------------------
+  // stripMemoryRecallMessages with <memory_context> format
+  // -----------------------------------------------------------------------
+  test("stripMemoryRecallMessages: strips <memory_context> XML format", () => {
+    type Msg = {
+      role: "user" | "assistant";
+      content: Array<{ type: string; text?: string }>;
+    };
+    const recallText = "<memory_context>\n\n<relevant_context>\nsome context\n</relevant_context>\n\n</memory_context>";
+    const msgs: Msg[] = [
+      {
+        role: "user",
+        content: [{ type: "text", text: recallText }],
       },
-      memory: {
-        ...TEST_CONFIG.memory,
-        entity: {
-          ...TEST_CONFIG.memory.entity,
-          enabled: false,
-        },
-        embeddings: {
-          ...TEST_CONFIG.memory.embeddings,
-          provider: "openai",
-          required: true,
-        },
+      {
+        role: "assistant",
+        content: [{ type: "text", text: "[Memory context loaded.]" }],
       },
+      {
+        role: "user",
+        content: [{ type: "text", text: "Hello, what do you know about me?" }],
+      },
+    ];
+    const cleaned = stripMemoryRecallMessages(msgs, recallText);
+    expect(cleaned).toHaveLength(1);
+    expect(cleaned[0].role).toBe("user");
+    expect(cleaned[0].content[0].text).toBe("Hello, what do you know about me?");
+  });
+  test("stripMemoryRecallMessages: handles <memory_context> with slightly different content", () => {
+    type Msg = {
+      role: "user" | "assistant";
+      content: Array<{ type: string; text?: string }>;
     };
+    const originalRecall = "<memory_context>\n\n<relevant_context>\noriginal\n</relevant_context>\n\n</memory_context>";
+    const actualRecall = "<memory_context>\n\n<relevant_context>\nslightly different\n</relevant_context>\n\n</memory_context>";
-    const result = await buildMemoryRecall(
-      "API design",
-      "conv-degrade-test",
-      noEntityConfig,
-    );
+    const msgs: Msg[] = [
+      {
+        role: "user",
+        content: [{ type: "text", text: actualRecall }],
+      },
+      {
+        role: "assistant",
+        content: [{ type: "text", text: "[Memory context loaded.]" }],
+      },
+      {
+        role: "user",
+        content: [{ type: "text", text: "follow-up question" }],
+      },
+    ];
-    expect(result.degradation).toBeDefined();
-    expect(result.degradation!.fallbackSources).not.toContain("entity");
-    expect(result.degradation!.fallbackSources).toContain("lexical");
-    expect(result.degradation!.fallbackSources).toContain("recency");
-    expect(result.degradation!.fallbackSources).toContain("direct_item");
+    // The <memory_context> tag-based matching should work even when exact text differs
+    const cleaned = stripMemoryRecallMessages(msgs, originalRecall);
+    expect(cleaned).toHaveLength(1);
+    expect(cleaned[0].content[0].text).toBe("follow-up question");
+  });
+  // -----------------------------------------------------------------------
+  // injectMemoryRecallAsSeparateMessage
+  // -----------------------------------------------------------------------
+  test("injectMemoryRecallAsSeparateMessage: injects context + ack before last user message", () => {
+    type Msg = {
+      role: "user" | "assistant";
+      content: Array<{ type: string; text?: string }>;
+    };
+    const msgs: Msg[] = [
+      {
+        role: "user",
+        content: [{ type: "text", text: "Hello" }],
+      },
+    ];
+    const recallText = "<memory_context>\n\n<relevant_context>\ntest\n</relevant_context>\n\n</memory_context>";
+    const result = injectMemoryRecallAsSeparateMessage(msgs, recallText);
+    expect(result).toHaveLength(3);
+    expect(result[0].role).toBe("user");
+    expect(result[0].content[0].text).toBe(recallText);
+    expect(result[1].role).toBe("assistant");
+    expect(result[1].content[0].text).toBe("[Memory context loaded.]");
+    expect(result[2].role).toBe("user");
+    expect(result[2].content[0].text).toBe("Hello");
+  });
+  test("injectMemoryRecallAsSeparateMessage: no-op for empty text", () => {
+    type Msg = {
+      role: "user" | "assistant";
+      content: Array<{ type: string; text?: string }>;
+    };
+    const msgs: Msg[] = [
+      {
+        role: "user",
+        content: [{ type: "text", text: "Hello" }],
+      },
+    ];
+    const result = injectMemoryRecallAsSeparateMessage(msgs, "");
+    expect(result).toHaveLength(1);
+    expect(result[0].content[0].text).toBe("Hello");
   });
   // -----------------------------------------------------------------------
   // Local embedding stub end-to-end
   // -----------------------------------------------------------------------
-  test("local embedding stub: pipeline completes non-degraded with zero-vector embeddings", async () => {
+  test("local embedding: pipeline completes non-degraded", async () => {
     seedMemory();
     const localEmbedConfig: AssistantConfig = {
@@ -624,7 +713,7 @@ describe("Memory Retriever Degradation", () => {
     const result = await buildMemoryRecall(
       "API design",
-      "conv-degrade-test",
+      "conv-test",
       localEmbedConfig,
     );
@@ -632,75 +721,7 @@ describe("Memory Retriever Degradation", () => {
     // pipeline proceeds non-degraded end-to-end.
     expect(result.enabled).toBe(true);
     expect(result.degraded).toBe(false);
-    expect(result.selectedCount).toBeGreaterThan(0);
-  });
-  // -----------------------------------------------------------------------
-  // Degraded results bypass the recall cache
-  // -----------------------------------------------------------------------
-  test("degraded results are not cached", async () => {
-    seedMemory();
-    // Trip the circuit breaker so semantic search fails
-    const { withQdrantBreaker } =
-      await import("../memory/qdrant-circuit-breaker.js");
-    for (let i = 0; i < 5; i++) {
-      try {
-        await withQdrantBreaker(async () => {
-          throw new Error("simulated qdrant failure");
-        });
-      } catch {
-        // expected
-      }
-    }
-    expect(isQdrantBreakerOpen()).toBe(true);
-    // Disable early termination so semantic search is attempted and fails,
-    // which sets semanticSearchFailed=true → result.degraded=true.
-    const degradedConfig: AssistantConfig = {
-      ...TEST_CONFIG,
-      memory: {
-        ...TEST_CONFIG.memory,
-        retrieval: {
-          ...TEST_CONFIG.memory.retrieval,
-          earlyTermination: {
-            ...TEST_CONFIG.memory.retrieval.earlyTermination,
-            enabled: false,
-          },
-        },
-      },
-    };
-    const first = await buildMemoryRecall(
-      "API design cache test",
-      "conv-degrade-test",
-      degradedConfig,
-    );
-    expect(first.degraded).toBe(true);
-    expect(first.selectedCount).toBeGreaterThan(0);
-    // Second call with same inputs — should NOT be served from cache.
-    // If the degraded result were incorrectly cached, this call would
-    // return instantly from cache. Instead it should re-execute the
-    // pipeline and produce a fresh degraded result.
-    const second = await buildMemoryRecall(
-      "API design cache test",
-      "conv-degrade-test",
-      degradedConfig,
-    );
-    expect(second.degraded).toBe(true);
-    expect(second.selectedCount).toBeGreaterThan(0);
-    // Verify the cache is empty for this query by resetting the breaker
-    // and calling again — a non-degraded result should come back (proving
-    // the degraded result was never cached).
-    _resetQdrantBreaker();
-    const recovered = await buildMemoryRecall(
-      "API design cache test",
-      "conv-degrade-test",
-      degradedConfig,
-    );
-    expect(recovered.degraded).toBe(false);
+    // Recency search finds candidates; hybrid search returns empty from mock
+    expect(result.recencyHits).toBeGreaterThan(0);
   });
 });