npm - @vellumai/assistant - Versions diffs - 0.4.49 → 0.4.50 - Mend

@vellumai/assistant 0.4.49 → 0.4.50

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (239) hide show

package/ARCHITECTURE.md +24 -33
package/README.md +3 -3
package/docs/architecture/memory.md +180 -119
package/package.json +2 -2
package/src/__tests__/agent-loop.test.ts +3 -1
package/src/__tests__/anthropic-provider.test.ts +114 -23
package/src/__tests__/approval-cascade.test.ts +1 -15
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-feature-flag-guard.test.ts +0 -23
package/src/__tests__/canonical-guardian-store.test.ts +95 -0
package/src/__tests__/checker.test.ts +13 -0
package/src/__tests__/config-schema.test.ts +1 -68
package/src/__tests__/context-memory-e2e.test.ts +11 -100
package/src/__tests__/conversation-routes-guardian-reply.test.ts +8 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-security-e2e.test.ts +1 -0
package/src/__tests__/credential-vault-unit.test.ts +4 -0
package/src/__tests__/credential-vault.test.ts +13 -1
package/src/__tests__/cu-unified-flow.test.ts +532 -0
package/src/__tests__/date-context.test.ts +93 -77
package/src/__tests__/deterministic-verification-control-plane.test.ts +64 -0
package/src/__tests__/guardian-routing-invariants.test.ts +93 -0
package/src/__tests__/history-repair.test.ts +245 -0
package/src/__tests__/host-cu-proxy.test.ts +165 -3
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/invite-redemption-service.test.ts +65 -1
package/src/__tests__/keychain-broker-client.test.ts +4 -4
package/src/__tests__/memory-context-benchmark.benchmark.test.ts +56 -18
package/src/__tests__/memory-lifecycle-e2e.test.ts +244 -387
package/src/__tests__/memory-recall-quality.test.ts +244 -407
package/src/__tests__/memory-regressions.experimental.test.ts +126 -101
package/src/__tests__/memory-regressions.test.ts +477 -2841
package/src/__tests__/memory-retrieval.benchmark.test.ts +33 -150
package/src/__tests__/memory-upsert-concurrency.test.ts +5 -244
package/src/__tests__/mime-builder.test.ts +28 -0
package/src/__tests__/native-web-search.test.ts +1 -0
package/src/__tests__/oauth-cli.test.ts +572 -5
package/src/__tests__/oauth-store.test.ts +120 -6
package/src/__tests__/qdrant-collection-migration.test.ts +53 -8
package/src/__tests__/registry.test.ts +0 -1
package/src/__tests__/relay-server.test.ts +46 -1
package/src/__tests__/schedule-tools.test.ts +32 -0
package/src/__tests__/script-proxy-certs.test.ts +1 -1
package/src/__tests__/secret-onetime-send.test.ts +1 -0
package/src/__tests__/secure-keys.test.ts +7 -2
package/src/__tests__/send-endpoint-busy.test.ts +3 -0
package/src/__tests__/session-abort-tool-results.test.ts +1 -14
package/src/__tests__/session-agent-loop-overflow.test.ts +1583 -0
package/src/__tests__/session-agent-loop.test.ts +19 -15
package/src/__tests__/session-confirmation-signals.test.ts +1 -15
package/src/__tests__/session-error.test.ts +124 -2
package/src/__tests__/session-history-web-search.test.ts +918 -0
package/src/__tests__/session-pre-run-repair.test.ts +1 -14
package/src/__tests__/session-provider-retry-repair.test.ts +25 -28
package/src/__tests__/session-queue.test.ts +37 -27
package/src/__tests__/session-runtime-assembly.test.ts +54 -0
package/src/__tests__/session-slash-known.test.ts +1 -15
package/src/__tests__/session-slash-queue.test.ts +1 -15
package/src/__tests__/session-slash-unknown.test.ts +1 -15
package/src/__tests__/session-workspace-cache-state.test.ts +3 -33
package/src/__tests__/session-workspace-injection.test.ts +3 -37
package/src/__tests__/session-workspace-tool-tracking.test.ts +3 -37
package/src/__tests__/skills-install-extract.test.ts +93 -0
package/src/__tests__/skillssh-registry.test.ts +451 -0
package/src/__tests__/trust-store.test.ts +15 -0
package/src/__tests__/voice-invite-redemption.test.ts +32 -1
package/src/agent/ax-tree-compaction.test.ts +51 -0
package/src/agent/loop.ts +39 -12
package/src/approvals/AGENTS.md +1 -1
package/src/approvals/guardian-request-resolvers.ts +14 -2
package/src/bundler/compiler-tools.ts +66 -2
package/src/calls/call-domain.ts +132 -0
package/src/calls/call-store.ts +6 -0
package/src/calls/relay-server.ts +43 -5
package/src/calls/relay-setup-router.ts +17 -1
package/src/calls/twilio-config.ts +1 -1
package/src/calls/types.ts +3 -1
package/src/cli/commands/doctor.ts +4 -3
package/src/cli/commands/mcp.ts +46 -59
package/src/cli/commands/memory.ts +16 -165
package/src/cli/commands/oauth/apps.ts +31 -2
package/src/cli/commands/oauth/connections.ts +431 -97
package/src/cli/commands/oauth/providers.ts +15 -1
package/src/cli/commands/sessions.ts +5 -2
package/src/cli/commands/skills.ts +173 -1
package/src/cli/http-client.ts +0 -20
package/src/cli/main-screen.tsx +2 -2
package/src/cli/program.ts +5 -6
package/src/cli.ts +4 -10
package/src/config/bundled-skills/computer-use/TOOLS.json +1 -1
package/src/config/bundled-skills/computer-use/tools/computer-use-observe.ts +12 -0
package/src/config/bundled-tool-registry.ts +2 -5
package/src/config/schema.ts +1 -12
package/src/config/schemas/memory-lifecycle.ts +0 -9
package/src/config/schemas/memory-processing.ts +0 -180
package/src/config/schemas/memory-retrieval.ts +32 -104
package/src/config/schemas/memory.ts +0 -10
package/src/config/types.ts +0 -4
package/src/context/window-manager.ts +4 -1
package/src/daemon/config-watcher.ts +61 -3
package/src/daemon/daemon-control.ts +1 -1
package/src/daemon/date-context.ts +114 -31
package/src/daemon/handlers/sessions.ts +18 -13
package/src/daemon/handlers/skills.ts +20 -1
package/src/daemon/history-repair.ts +72 -8
package/src/daemon/host-cu-proxy.ts +55 -26
package/src/daemon/lifecycle.ts +31 -3
package/src/daemon/mcp-reload-service.ts +2 -2
package/src/daemon/message-types/computer-use.ts +1 -12
package/src/daemon/message-types/memory.ts +4 -16
package/src/daemon/message-types/messages.ts +1 -0
package/src/daemon/message-types/sessions.ts +4 -0
package/src/daemon/server.ts +12 -1
package/src/daemon/session-agent-loop-handlers.ts +38 -0
package/src/daemon/session-agent-loop.ts +334 -48
package/src/daemon/session-error.ts +89 -6
package/src/daemon/session-history.ts +17 -7
package/src/daemon/session-media-retry.ts +6 -2
package/src/daemon/session-memory.ts +69 -149
package/src/daemon/session-process.ts +10 -1
package/src/daemon/session-runtime-assembly.ts +49 -19
package/src/daemon/session-surfaces.ts +4 -1
package/src/daemon/session-tool-setup.ts +7 -1
package/src/daemon/session.ts +12 -2
package/src/instrument.ts +61 -1
package/src/memory/admin.ts +2 -191
package/src/memory/canonical-guardian-store.ts +38 -2
package/src/memory/conversation-crud.ts +0 -33
package/src/memory/conversation-queries.ts +22 -3
package/src/memory/db-init.ts +28 -0
package/src/memory/embedding-backend.ts +84 -8
package/src/memory/embedding-types.ts +9 -1
package/src/memory/indexer.ts +7 -46
package/src/memory/items-extractor.ts +274 -76
package/src/memory/job-handlers/backfill.ts +2 -127
package/src/memory/job-handlers/cleanup.ts +2 -16
package/src/memory/job-handlers/extraction.ts +2 -138
package/src/memory/job-handlers/index-maintenance.ts +1 -6
package/src/memory/job-handlers/summarization.ts +3 -148
package/src/memory/job-utils.ts +21 -59
package/src/memory/jobs-store.ts +1 -159
package/src/memory/jobs-worker.ts +9 -52
package/src/memory/migrations/104-core-indexes.ts +3 -3
package/src/memory/migrations/149-oauth-tables.ts +2 -0
package/src/memory/migrations/150-oauth-apps-client-secret-path.ts +98 -0
package/src/memory/migrations/151-oauth-providers-ping-url.ts +11 -0
package/src/memory/migrations/152-memory-item-supersession.ts +44 -0
package/src/memory/migrations/153-drop-entity-tables.ts +15 -0
package/src/memory/migrations/154-drop-fts.ts +20 -0
package/src/memory/migrations/155-drop-conflicts.ts +7 -0
package/src/memory/migrations/156-call-session-invite-metadata.ts +24 -0
package/src/memory/migrations/index.ts +7 -0
package/src/memory/qdrant-client.ts +148 -51
package/src/memory/raw-query.ts +1 -1
package/src/memory/retriever.test.ts +294 -273
package/src/memory/retriever.ts +421 -645
package/src/memory/schema/calls.ts +2 -0
package/src/memory/schema/memory-core.ts +3 -48
package/src/memory/schema/oauth.ts +2 -0
package/src/memory/search/formatting.ts +263 -176
package/src/memory/search/lexical.ts +1 -254
package/src/memory/search/ranking.ts +0 -455
package/src/memory/search/semantic.ts +100 -14
package/src/memory/search/staleness.ts +47 -0
package/src/memory/search/tier-classifier.ts +21 -0
package/src/memory/search/types.ts +15 -77
package/src/memory/task-memory-cleanup.ts +4 -6
package/src/messaging/providers/gmail/mime-builder.ts +17 -7
package/src/oauth/byo-connection.test.ts +8 -1
package/src/oauth/oauth-store.ts +113 -27
package/src/oauth/seed-providers.ts +6 -0
package/src/oauth/token-persistence.ts +11 -3
package/src/permissions/defaults.ts +1 -0
package/src/permissions/trust-store.ts +23 -1
package/src/playbooks/playbook-compiler.ts +1 -1
package/src/prompts/system-prompt.ts +18 -2
package/src/providers/anthropic/client.ts +56 -126
package/src/providers/types.ts +7 -1
package/src/runtime/AGENTS.md +9 -0
package/src/runtime/auth/route-policy.ts +6 -3
package/src/runtime/guardian-reply-router.ts +24 -22
package/src/runtime/http-server.ts +2 -2
package/src/runtime/invite-redemption-service.ts +19 -1
package/src/runtime/invite-service.ts +25 -0
package/src/runtime/pending-interactions.ts +2 -2
package/src/runtime/routes/brain-graph-routes.ts +10 -90
package/src/runtime/routes/conversation-routes.ts +9 -1
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +21 -12
package/src/runtime/routes/memory-item-routes.test.ts +754 -0
package/src/runtime/routes/memory-item-routes.ts +503 -0
package/src/runtime/routes/session-management-routes.ts +3 -3
package/src/runtime/routes/settings-routes.ts +2 -2
package/src/runtime/routes/trust-rules-routes.ts +14 -0
package/src/runtime/routes/workspace-routes.ts +2 -1
package/src/security/keychain-broker-client.ts +17 -4
package/src/security/secure-keys.ts +25 -3
package/src/security/token-manager.ts +36 -36
package/src/skills/catalog-install.ts +74 -18
package/src/skills/skillssh-registry.ts +503 -0
package/src/tools/assets/search.ts +5 -1
package/src/tools/computer-use/definitions.ts +0 -10
package/src/tools/computer-use/registry.ts +1 -1
package/src/tools/credentials/vault.ts +1 -3
package/src/tools/memory/definitions.ts +4 -13
package/src/tools/memory/handlers.test.ts +83 -103
package/src/tools/memory/handlers.ts +50 -85
package/src/tools/schedule/create.ts +8 -1
package/src/tools/schedule/update.ts +8 -1
package/src/tools/skills/load.ts +25 -2
package/src/__tests__/clarification-resolver.test.ts +0 -193
package/src/__tests__/conflict-intent-tokenization.test.ts +0 -160
package/src/__tests__/conflict-policy.test.ts +0 -269
package/src/__tests__/conflict-store.test.ts +0 -372
package/src/__tests__/contradiction-checker.test.ts +0 -361
package/src/__tests__/entity-extractor.test.ts +0 -211
package/src/__tests__/entity-search.test.ts +0 -1117
package/src/__tests__/profile-compiler.test.ts +0 -392
package/src/__tests__/session-conflict-gate.test.ts +0 -1228
package/src/__tests__/session-profile-injection.test.ts +0 -557
package/src/config/bundled-skills/knowledge-graph/SKILL.md +0 -25
package/src/config/bundled-skills/knowledge-graph/TOOLS.json +0 -66
package/src/config/bundled-skills/knowledge-graph/tools/graph-query.ts +0 -211
package/src/daemon/session-conflict-gate.ts +0 -167
package/src/daemon/session-dynamic-profile.ts +0 -77
package/src/memory/clarification-resolver.ts +0 -417
package/src/memory/conflict-intent.ts +0 -205
package/src/memory/conflict-policy.ts +0 -127
package/src/memory/conflict-store.ts +0 -410
package/src/memory/contradiction-checker.ts +0 -508
package/src/memory/entity-extractor.ts +0 -535
package/src/memory/format-recall.ts +0 -47
package/src/memory/fts-reconciler.ts +0 -165
package/src/memory/job-handlers/conflict.ts +0 -200
package/src/memory/profile-compiler.ts +0 -195
package/src/memory/recall-cache.ts +0 -117
package/src/memory/search/entity.ts +0 -535
package/src/memory/search/query-expansion.test.ts +0 -70
package/src/memory/search/query-expansion.ts +0 -118
package/src/runtime/routes/mcp-routes.ts +0 -20

package/src/memory/items-extractor.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { and, eq, sql } from "drizzle-orm";
+import { and, eq, like, sql } from "drizzle-orm";
 import { v4 as uuid } from "uuid";
 import { getConfig } from "../config/loader.js";
@@ -15,30 +15,23 @@ import { getDb } from "./db.js";
 import { computeMemoryFingerprint } from "./fingerprint.js";
 import { enqueueMemoryJob } from "./jobs-store.js";
 import { extractTextFromStoredMessageContent } from "./message-content.js";
-import {
-  memoryItemConflicts,
-  memoryItems,
-  memoryItemSources,
-  messages,
-} from "./schema.js";
+import { withQdrantBreaker } from "./qdrant-circuit-breaker.js";
+import { getQdrantClient } from "./qdrant-client.js";
+import { memoryItems, memoryItemSources, messages } from "./schema.js";
 import { isConversationFailed } from "./task-memory-cleanup.js";
 import { clampUnitInterval } from "./validation.js";
 const log = getLogger("memory-items-extractor");
 export type MemoryItemKind =
+  | "identity"
   | "preference"
-  | "profile"
   | "project"
   | "decision"
-  | "todo"
-  | "fact"
   | "constraint"
-  | "relationship"
-  | "event"
-  | "opinion"
-  | "instruction"
-  | "style";
+  | "event";
+export type OverrideConfidence = "explicit" | "tentative" | "inferred";
 interface ExtractedItem {
   kind: MemoryItemKind;
@@ -47,26 +40,37 @@ interface ExtractedItem {
   confidence: number;
   importance: number;
   fingerprint: string;
+  supersedes: string | null;
+  overrideConfidence: OverrideConfidence;
+  /** True when the LLM emitted a supersedes ID that was rejected (hallucinated). */
+  supersedesRejected?: boolean;
 }
 const VALID_KINDS = new Set<string>([
+  "identity",
   "preference",
-  "profile",
   "project",
   "decision",
-  "todo",
-  "fact",
   "constraint",
-  "relationship",
   "event",
-  "opinion",
-  "instruction",
-  "style",
 ]);
+/** Maps old kind names to their new equivalents for graceful migration. */
+const KIND_MIGRATION_MAP: Record<string, MemoryItemKind> = {
+  profile: "identity",
+  fact: "identity",
+  relationship: "identity",
+  opinion: "preference",
+  todo: "project",
+  instruction: "constraint",
+  style: "preference",
+};
 const SUPERSEDE_KINDS = new Set<MemoryItemKind>([
-  "decision",
+  "identity",
   "preference",
+  "project",
+  "decision",
   "constraint",
 ]);
@@ -129,32 +133,39 @@ function hasSemanticDensity(text: string): boolean {
 // ── LLM-powered extraction ────────────────────────────────────────────
-const EXTRACTION_SYSTEM_PROMPT = `You are a memory extraction system. Given a message from a conversation, extract structured memory items that would be valuable to remember for future interactions.
+function buildExtractionSystemPrompt(
+  existingItems: Array<{
+    id: string;
+    kind: string;
+    subject: string;
+    statement: string;
+  }>,
+): string {
+  let prompt = `You are a memory extraction system. Given a message from a conversation, extract structured memory items that would be valuable to remember for future interactions.
 Extract items in these categories:
-- preference: User likes, dislikes, preferred approaches/tools/styles
-- profile: Personal info (name, role, location, timezone, background)
-- project: Project names, repos, tech stacks, architecture details
+- identity: Personal info (name, role, location, timezone, background), notable facts, relationships between people/teams/systems
+- preference: User likes, dislikes, preferred approaches/tools/styles, communication style patterns, opinions and evaluations
+- project: Project names, repos, tech stacks, architecture details, action items, follow-ups, things to do later
 - decision: Choices made, approaches selected, trade-offs resolved
-- todo: Action items, follow-ups, things to do later
-- fact: Notable facts, definitions, technical details worth remembering
-- constraint: Rules, requirements, things that must/must not be done
-- relationship: Connections between people, teams, projects, systems
+- constraint: Rules, requirements, things that must/must not be done, explicit directives on how the assistant should behave
 - event: Deadlines, milestones, meetings, releases, dates
-- opinion: Viewpoints, assessments, evaluations of tools/approaches
-- instruction: Explicit directives on how the assistant should behave
-- style: Communication style patterns — writing tone, formatting habits, vocabulary choices, greeting/sign-off conventions
 For each item, provide:
 - kind: One of the categories above
 - subject: A short label (2-8 words) identifying what this is about
-- statement: The full factual statement to remember (1-2 sentences)
+- statement: A relationship-rich factual statement to remember (1-2 sentences). Include relational context — who recommended it, why it matters, how it connects to other facts. For example, write "Data processing library that Sarah from Marketing recommended for the Q4 pipeline rewrite" instead of just "Uses pandas".
 - confidence: How confident you are this is accurate (0.0-1.0)
 - importance: How valuable this is to remember (0.0-1.0)
   - 1.0: Explicit user instructions about assistant behavior
   - 0.8-0.9: Personal facts, strong preferences, key decisions
   - 0.6-0.7: Project details, constraints, opinions
   - 0.3-0.5: Contextual details, minor preferences
+- supersedes: If this item replaces an existing memory item, set this to the ID of the item it replaces. Use null if it does not replace anything. Determine supersession by understanding the semantic meaning — do not rely on keyword matching.
+- overrideConfidence: How confident you are that this overrides an existing item:
+  - "explicit": Clear override signal (e.g., "Actually I now prefer X", "I changed my mind about Y", "We switched from A to B")
+  - "tentative": Ambiguous — the new information might override the old, but it's not certain
+  - "inferred": Weak signal — possibly related to an existing item but no clear override intent
 Rules:
 - Only extract genuinely memorable information. Skip pleasantries, filler, and transient discussion.
@@ -163,12 +174,94 @@ Rules:
 - Prefer fewer high-quality items over many low-quality ones.
 - If the message contains no memorable information, return an empty array.`;
+  if (existingItems.length > 0) {
+    prompt += `\n\nExisting memory items (use these to identify supersession targets — set \`supersedes\` to the item ID if the new information replaces one of these):\n`;
+    for (const item of existingItems) {
+      prompt += `- [${item.id}] (${item.kind}) ${item.subject}: ${item.statement}\n`;
+    }
+  }
+  return prompt;
+}
+const VALID_OVERRIDE_CONFIDENCES = new Set<string>([
+  "explicit",
+  "tentative",
+  "inferred",
+]);
 interface LLMExtractedItem {
   kind: string;
   subject: string;
   statement: string;
   confidence: number;
   importance: number;
+  supersedes: string | null;
+  overrideConfidence: string;
+}
+/**
+ * Query top-10 active items by kind + subject similarity to give the
+ * extraction LLM awareness of existing items it might supersede.
+ * This is a write-path-only heuristic — not used at read time.
+ */
+function queryExistingItemsForContext(
+  scopeId: string,
+  text: string,
+): Array<{ id: string; kind: string; subject: string; statement: string }> {
+  const db = getDb();
+  // Extract a rough subject prefix from the first few words of the text
+  const words = text.trim().split(/\s+/).slice(0, 3).join(" ");
+  // Escape LIKE wildcards so user text with % or _ doesn't alter query semantics
+  const escaped = words.replace(/%/g, "").replace(/_/g, "");
+  const subjectPrefix = escaped.length > 0 ? `${escaped}%` : "%";
+  // Query active items matching subject prefix, limited to 10
+  const rows = db
+    .select({
+      id: memoryItems.id,
+      kind: memoryItems.kind,
+      subject: memoryItems.subject,
+      statement: memoryItems.statement,
+    })
+    .from(memoryItems)
+    .where(
+      and(
+        eq(memoryItems.scopeId, scopeId),
+        eq(memoryItems.status, "active"),
+        like(memoryItems.subject, subjectPrefix),
+      ),
+    )
+    .limit(10)
+    .all();
+  // If prefix match yielded few results, backfill with recent active items
+  if (rows.length < 10) {
+    const existingIds = new Set(rows.map((r) => r.id));
+    const backfill = db
+      .select({
+        id: memoryItems.id,
+        kind: memoryItems.kind,
+        subject: memoryItems.subject,
+        statement: memoryItems.statement,
+      })
+      .from(memoryItems)
+      .where(
+        and(eq(memoryItems.scopeId, scopeId), eq(memoryItems.status, "active")),
+      )
+      .limit(10 - rows.length)
+      .all();
+    for (const row of backfill) {
+      if (!existingIds.has(row.id)) {
+        rows.push(row);
+        existingIds.add(row.id);
+      }
+    }
+  }
+  return rows;
 }
 async function extractItemsWithLLM(
@@ -188,6 +281,10 @@ async function extractItemsWithLLM(
     const { signal, cleanup } = createTimeout(15000);
     try {
+      // Query existing items to give the LLM supersession context
+      const existingItems = queryExistingItemsForContext(scopeId, text);
+      const systemPrompt = buildExtractionSystemPrompt(existingItems);
       const response = await provider.sendMessage(
         [userMessage(text)],
         [
@@ -215,7 +312,7 @@ async function extractItemsWithLLM(
                       statement: {
                         type: "string",
                         description:
-                          "Full factual statement to remember (1-2 sentences)",
+                          "Relationship-rich factual statement to remember (1-2 sentences). Include relational context.",
                       },
                       confidence: {
                         type: "number",
@@ -227,6 +324,17 @@ async function extractItemsWithLLM(
                         description:
                           "How valuable this is to remember (0.0-1.0)",
                       },
+                      supersedes: {
+                        type: ["string", "null"],
+                        description:
+                          "ID of the existing memory item this replaces, or null if not replacing anything",
+                      },
+                      overrideConfidence: {
+                        type: "string",
+                        enum: ["explicit", "tentative", "inferred"],
+                        description:
+                          "How confident you are that this overrides an existing item: explicit (clear override), tentative (ambiguous), inferred (weak signal)",
+                      },
                     },
                     required: [
                       "kind",
@@ -234,6 +342,8 @@ async function extractItemsWithLLM(
                       "statement",
                       "confidence",
                       "importance",
+                      "supersedes",
+                      "overrideConfidence",
                     ],
                   },
                 },
@@ -242,7 +352,7 @@ async function extractItemsWithLLM(
             },
           },
         ],
-        EXTRACTION_SYSTEM_PROMPT,
+        systemPrompt,
         {
           config: {
             modelIntent: extractionConfig.modelIntent,
@@ -270,9 +380,14 @@ async function extractItemsWithLLM(
         return extractItemsPatternBased(text, scopeId);
       }
+      // Build set of known existing item IDs for supersession validation
+      const existingItemIds = new Set(existingItems.map((e) => e.id));
       const items: ExtractedItem[] = [];
       for (const raw of input.items) {
-        if (!VALID_KINDS.has(raw.kind)) continue;
+        // Apply kind migration map for old kind names, then validate
+        const resolvedKind = KIND_MIGRATION_MAP[raw.kind] ?? raw.kind;
+        if (!VALID_KINDS.has(resolvedKind)) continue;
         if (!raw.subject || !raw.statement) continue;
         const subject = truncate(String(raw.subject), 80, "");
         const statement = truncate(String(raw.statement), 500, "");
@@ -280,17 +395,38 @@ async function extractItemsWithLLM(
         const importance = clampUnitInterval(parseScore(raw.importance, 0.5));
         const fingerprint = computeMemoryFingerprint(
           scopeId,
-          raw.kind,
+          resolvedKind,
           subject,
           statement,
         );
+        // Validate supersedes: must reference a known existing item ID.
+        // Reject hallucinated IDs that don't match any item we showed the LLM.
+        const rawSupersedes =
+          typeof raw.supersedes === "string" && raw.supersedes.length > 0
+            ? raw.supersedes
+            : null;
+        const supersedes =
+          rawSupersedes && existingItemIds.has(rawSupersedes)
+            ? rawSupersedes
+            : null;
+        const supersedesRejected = !!rawSupersedes && !supersedes;
+        const overrideConfidence = VALID_OVERRIDE_CONFIDENCES.has(
+          raw.overrideConfidence,
+        )
+          ? (raw.overrideConfidence as OverrideConfidence)
+          : "inferred";
         items.push({
-          kind: raw.kind as MemoryItemKind,
+          kind: resolvedKind as MemoryItemKind,
           subject,
           statement,
           confidence,
           importance,
           fingerprint,
+          supersedes,
+          overrideConfidence,
+          supersedesRejected,
         });
       }
@@ -387,12 +523,7 @@ export async function extractAndUpsertMemoryItemsForMessage(
         verificationState === "user_reported"
           ? "user_reported"
           : existing.verificationState;
-      // Preserve pending_clarification if this item has an unresolved conflict
-      effectiveStatus =
-        existing.status === "pending_clarification" &&
-        hasPendingConflict(existing.id)
-          ? "pending_clarification"
-          : "active";
+      effectiveStatus = "active";
       db.update(memoryItems)
         .set({
           status: effectiveStatus,
@@ -424,16 +555,103 @@ export async function extractAndUpsertMemoryItemsForMessage(
           firstSeenAt: message.createdAt,
           lastSeenAt: seenAt,
           lastUsedAt: null,
+          supersedes: item.supersedes,
+          overrideConfidence: item.overrideConfidence,
         })
         .run();
       upserted += 1;
     }
-    // Only supersede other items when this item is active — a
-    // pending_clarification item should not demote the existing active
-    // item, since that would leave no retrievable memory until manual
-    // conflict resolution occurs.
-    if (SUPERSEDE_KINDS.has(item.kind) && effectiveStatus === "active") {
+    // Handle LLM-directed supersession based on overrideConfidence.
+    // Guard: skip if supersedes targets the current item (self-supersession on
+    // fingerprint re-hit would incorrectly remove an active memory).
+    if (
+      item.supersedes &&
+      item.supersedes !== memoryItemId &&
+      item.overrideConfidence === "explicit" &&
+      effectiveStatus === "active"
+    ) {
+      // Explicit supersession: mark old item as superseded and link both items
+      const oldItem = db
+        .select({ id: memoryItems.id })
+        .from(memoryItems)
+        .where(
+          and(
+            eq(memoryItems.id, item.supersedes),
+            eq(memoryItems.scopeId, effectiveScopeId),
+            eq(memoryItems.status, "active"),
+          ),
+        )
+        .get();
+      if (oldItem) {
+        db.update(memoryItems)
+          .set({
+            status: "superseded",
+            supersededBy: memoryItemId,
+          })
+          .where(eq(memoryItems.id, oldItem.id))
+          .run();
+        // Update new item's supersedes link
+        db.update(memoryItems)
+          .set({ supersedes: oldItem.id })
+          .where(eq(memoryItems.id, memoryItemId))
+          .run();
+        // Remove superseded item from Qdrant vector index
+        try {
+          const qdrant = getQdrantClient();
+          await withQdrantBreaker(() =>
+            qdrant.deleteByTarget("item", oldItem.id),
+          );
+        } catch (err) {
+          const errMsg = err instanceof Error ? err.message : String(err);
+          log.warn(
+            { err: errMsg, oldItemId: oldItem.id },
+            "Failed to remove superseded item from Qdrant — will be cleaned up by index maintenance",
+          );
+        }
+        log.debug(
+          { newItemId: memoryItemId, oldItemId: oldItem.id },
+          "Explicitly superseded memory item",
+        );
+      }
+    } else if (item.supersedes && item.overrideConfidence === "tentative") {
+      // Tentative: insert as active but don't supersede — both coexist
+      log.debug(
+        {
+          newItemId: memoryItemId,
+          supersedes: item.supersedes,
+          overrideConfidence: "tentative",
+        },
+        "Tentative override — both items coexist",
+      );
+    } else if (item.supersedes && item.overrideConfidence === "inferred") {
+      // Inferred: insert as active, don't supersede, log for observability
+      log.debug(
+        {
+          newItemId: memoryItemId,
+          supersedes: item.supersedes,
+          overrideConfidence: "inferred",
+        },
+        "Inferred override — both items coexist (weak signal)",
+      );
+    }
+    // Fallback subject-match supersession: only when the LLM did not
+    // explicitly handle supersession for this item. This preserves the
+    // original behavior for pattern-based extraction and items without
+    // LLM-directed supersession. Skip items whose supersedes ID was
+    // rejected (hallucinated) — they should coexist, not trigger
+    // subject-based replacement.
+    if (
+      !item.supersedes &&
+      !item.supersedesRejected &&
+      SUPERSEDE_KINDS.has(item.kind) &&
+      effectiveStatus === "active"
+    ) {
       db.update(memoryItems)
         .set({ status: "superseded" })
         .where(
@@ -459,11 +677,6 @@ export async function extractAndUpsertMemoryItemsForMessage(
       .run();
     enqueueMemoryJob("embed_item", { itemId: memoryItemId });
-    // Queue contradiction check for newly inserted items
-    if (!existing) {
-      enqueueMemoryJob("check_contradictions", { itemId: memoryItemId });
-    }
   }
   log.debug(
@@ -504,6 +717,8 @@ function extractItemsPatternBased(
       confidence: classification.confidence,
       importance: classification.importance,
       fingerprint,
+      supersedes: null,
+      overrideConfidence: "inferred" as OverrideConfidence,
     });
   }
@@ -533,7 +748,7 @@ function classifySentence(
       "timezone",
     ])
   ) {
-    return { kind: "profile", confidence: 0.72, importance: 0.8 };
+    return { kind: "identity", confidence: 0.72, importance: 0.8 };
   }
   if (includesAny(lower, ["project", "repository", "repo", "codebase"])) {
     return { kind: "project", confidence: 0.68, importance: 0.6 };
@@ -546,7 +761,7 @@ function classifySentence(
   if (
     includesAny(lower, ["todo", "to do", "next step", "follow up", "need to"])
   ) {
-    return { kind: "todo", confidence: 0.74, importance: 0.6 };
+    return { kind: "project", confidence: 0.74, importance: 0.6 };
   }
   if (
     includesAny(lower, [
@@ -560,7 +775,7 @@ function classifySentence(
     return { kind: "constraint", confidence: 0.7, importance: 0.7 };
   }
   if (includesAny(lower, ["remember", "important", "fact", "noted"])) {
-    return { kind: "fact", confidence: 0.62, importance: 0.5 };
+    return { kind: "identity", confidence: 0.62, importance: 0.5 };
   }
   return null;
 }
@@ -603,20 +818,3 @@ function parseScore(value: unknown, fallback: number): number {
   const n = Number(value);
   return Number.isFinite(n) ? n : fallback;
 }
-/** Returns true if the given memory item is the candidate in an unresolved conflict. */
-function hasPendingConflict(itemId: string): boolean {
-  const db = getDb();
-  const row = db
-    .select({ id: memoryItemConflicts.id })
-    .from(memoryItemConflicts)
-    .where(
-      and(
-        eq(memoryItemConflicts.candidateItemId, itemId),
-        eq(memoryItemConflicts.status, "pending_clarification"),
-      ),
-    )
-    .limit(1)
-    .get();
-  return row != null;
-}

package/src/memory/job-handlers/backfill.ts CHANGED Viewed

@@ -1,8 +1,7 @@
-import { and, asc, eq, gt, ne, or } from "drizzle-orm";
+import { and, asc, eq, gt, or } from "drizzle-orm";
 import type { AssistantConfig } from "../../config/types.js";
 import type { TrustClass } from "../../runtime/actor-trust-resolver.js";
-import { getLogger } from "../../util/logger.js";
 import {
   readMessageCursorCheckpoint,
   resetMessageCursorCheckpoint,
@@ -14,21 +13,11 @@ import {
 } from "../conversation-crud.js";
 import { getDb } from "../db.js";
 import { indexMessageNow } from "../indexer.js";
-import {
-  enqueueBackfillEntityRelationsJob,
-  enqueueMemoryJob,
-  type MemoryJob,
-} from "../jobs-store.js";
+import { enqueueMemoryJob, type MemoryJob } from "../jobs-store.js";
 import { messages } from "../schema.js";
-const log = getLogger("memory-jobs-worker");
 const BACKFILL_CHECKPOINT_KEY = "memory:backfill:last_created_at";
 const BACKFILL_CHECKPOINT_ID_KEY = "memory:backfill:last_message_id";
-const RELATION_BACKFILL_CHECKPOINT_KEY =
-  "memory:relation_backfill:last_created_at";
-const RELATION_BACKFILL_CHECKPOINT_ID_KEY =
-  "memory:relation_backfill:last_message_id";
 function parseProvenanceTrustClass(
   rawMetadata: string | null,
@@ -43,10 +32,6 @@ function parseProvenanceTrustClass(
   }
 }
-function isTrustedTrustClass(trustClass: TrustClass | undefined): boolean {
-  return trustClass === "guardian" || trustClass === undefined;
-}
 export function backfillJob(job: MemoryJob, config: AssistantConfig): void {
   const db = getDb();
   const force = job.payload.force === true;
@@ -114,115 +99,5 @@ export function backfillJob(job: MemoryJob, config: AssistantConfig): void {
   if (batch.length === 200) {
     enqueueMemoryJob("backfill", {});
-  } else if (
-    config.memory.entity.enabled &&
-    config.memory.entity.extractRelations.enabled
-  ) {
-    // Enqueue after the terminal batch (including an empty batch when total
-    // messages are an exact multiple of 200) so the relation backfill does not
-    // overlap with messages the normal backfill already covered via
-    // indexMessageNow → extract_items → extract_entities.
-    enqueueBackfillEntityRelationsJob();
   }
 }
-export function backfillEntityRelationsJob(
-  job: MemoryJob,
-  config: AssistantConfig,
-): void {
-  if (!config.memory.entity.enabled) return;
-  if (!config.memory.entity.extractRelations.enabled) return;
-  const force = job.payload.force === true;
-  if (force) {
-    resetMessageCursorCheckpoint(
-      RELATION_BACKFILL_CHECKPOINT_KEY,
-      RELATION_BACKFILL_CHECKPOINT_ID_KEY,
-    );
-  }
-  const db = getDb();
-  const cursor = readMessageCursorCheckpoint(
-    RELATION_BACKFILL_CHECKPOINT_KEY,
-    RELATION_BACKFILL_CHECKPOINT_ID_KEY,
-  );
-  const batchSize = Math.max(
-    1,
-    config.memory.entity.extractRelations.backfillBatchSize,
-  );
-  const afterCursor = or(
-    gt(messages.createdAt, cursor.createdAt),
-    and(
-      eq(messages.createdAt, cursor.createdAt),
-      gt(messages.id, cursor.messageId),
-    ),
-  );
-  // Honor extractFromAssistant config — same role filter as indexMessageNow
-  const roleFilter = config.memory.extraction.extractFromAssistant
-    ? undefined
-    : ne(messages.role, "assistant");
-  const conditions = roleFilter ? and(afterCursor, roleFilter) : afterCursor;
-  const batch = db
-    .select({
-      id: messages.id,
-      conversationId: messages.conversationId,
-      role: messages.role,
-      createdAt: messages.createdAt,
-      metadata: messages.metadata,
-    })
-    .from(messages)
-    .where(conditions)
-    .orderBy(asc(messages.createdAt), asc(messages.id))
-    .limit(batchSize)
-    .all();
-  if (batch.length === 0) return;
-  const scopeCache = new Map<string, string>();
-  let queuedExtractEntityJobs = 0;
-  let skippedUntrusted = 0;
-  for (const message of batch) {
-    const provenanceTrustClass = parseProvenanceTrustClass(
-      message.metadata ?? null,
-    );
-    if (!isTrustedTrustClass(provenanceTrustClass)) {
-      skippedUntrusted += 1;
-      continue;
-    }
-    let scopeId = scopeCache.get(message.conversationId);
-    if (scopeId === undefined) {
-      scopeId = getConversationMemoryScopeId(message.conversationId);
-      scopeCache.set(message.conversationId, scopeId);
-    }
-    enqueueMemoryJob("extract_entities", { messageId: message.id, scopeId });
-    queuedExtractEntityJobs += 1;
-  }
-  const lastMessage = batch[batch.length - 1];
-  writeMessageCursorCheckpoint(
-    RELATION_BACKFILL_CHECKPOINT_KEY,
-    RELATION_BACKFILL_CHECKPOINT_ID_KEY,
-    {
-      createdAt: lastMessage.createdAt,
-      messageId: lastMessage.id,
-    },
-  );
-  if (batch.length === batchSize) {
-    enqueueBackfillEntityRelationsJob();
-  }
-  log.debug(
-    {
-      queuedExtractEntityJobs,
-      skippedUntrusted,
-      batchSize,
-      lastCreatedAt: lastMessage.createdAt,
-      lastMessageId: lastMessage.id,
-    },
-    "Queued relation backfill batch",
-  );
-}