npm - @vellumai/assistant - Versions diffs - 0.5.4 → 0.5.6 - Mend

@vellumai/assistant 0.5.4 → 0.5.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (151) hide show

package/Dockerfile +17 -27
package/node_modules/@vellumai/ces-contracts/src/index.ts +1 -0
package/node_modules/@vellumai/ces-contracts/src/trust-rules.ts +42 -0
package/package.json +1 -1
package/src/__tests__/actor-token-service.test.ts +113 -0
package/src/__tests__/config-schema.test.ts +2 -2
package/src/__tests__/context-window-manager.test.ts +78 -0
package/src/__tests__/conversation-title-service.test.ts +30 -1
package/src/__tests__/credential-security-invariants.test.ts +2 -0
package/src/__tests__/docker-signing-key-bootstrap.test.ts +207 -0
package/src/__tests__/memory-regressions.test.ts +8 -30
package/src/__tests__/openai-whisper.test.ts +93 -0
package/src/__tests__/require-fresh-approval.test.ts +4 -0
package/src/__tests__/slack-messaging-token-resolution.test.ts +319 -0
package/src/__tests__/tool-executor-lifecycle-events.test.ts +4 -0
package/src/__tests__/tool-executor.test.ts +4 -0
package/src/__tests__/volume-security-guard.test.ts +155 -0
package/src/cli/commands/conversations.ts +0 -18
package/src/config/bundled-skills/messaging/tools/shared.ts +1 -0
package/src/config/bundled-skills/transcribe/tools/transcribe-media.ts +16 -37
package/src/config/env-registry.ts +9 -0
package/src/config/env.ts +8 -2
package/src/config/feature-flag-registry.json +8 -8
package/src/config/schema.ts +0 -12
package/src/config/schemas/memory.ts +0 -4
package/src/config/schemas/platform.ts +1 -1
package/src/config/schemas/security.ts +4 -0
package/src/context/window-manager.ts +53 -2
package/src/credential-execution/managed-catalog.ts +5 -15
package/src/daemon/conversation-agent-loop.ts +0 -60
package/src/daemon/conversation-memory.ts +0 -117
package/src/daemon/conversation-runtime-assembly.ts +0 -2
package/src/daemon/daemon-control.ts +7 -0
package/src/daemon/handlers/conversations.ts +0 -11
package/src/daemon/lifecycle.ts +10 -47
package/src/daemon/providers-setup.ts +2 -1
package/src/followups/followup-store.ts +5 -2
package/src/hooks/manager.ts +7 -0
package/src/instrument.ts +33 -1
package/src/memory/conversation-crud.ts +0 -236
package/src/memory/conversation-title-service.ts +26 -10
package/src/memory/db-init.ts +5 -13
package/src/memory/embedding-local.ts +11 -5
package/src/memory/indexer.ts +15 -106
package/src/memory/job-handlers/conversation-starters.ts +24 -36
package/src/memory/job-handlers/embedding.ts +0 -79
package/src/memory/job-utils.ts +1 -1
package/src/memory/jobs-store.ts +0 -8
package/src/memory/jobs-worker.ts +0 -20
package/src/memory/migrations/189-drop-simplified-memory.ts +42 -0
package/src/memory/migrations/index.ts +1 -3
package/src/memory/qdrant-client.ts +4 -6
package/src/memory/schema/conversations.ts +0 -3
package/src/memory/schema/index.ts +0 -2
package/src/messaging/draft-store.ts +2 -2
package/src/messaging/provider.ts +9 -0
package/src/messaging/providers/slack/adapter.ts +29 -2
package/src/oauth/connection-resolver.test.ts +22 -18
package/src/oauth/connection-resolver.ts +92 -7
package/src/oauth/platform-connection.test.ts +78 -69
package/src/oauth/platform-connection.ts +12 -19
package/src/permissions/defaults.ts +3 -3
package/src/permissions/trust-client.ts +332 -0
package/src/permissions/trust-store-interface.ts +105 -0
package/src/permissions/trust-store.ts +531 -39
package/src/platform/client.test.ts +148 -0
package/src/platform/client.ts +71 -0
package/src/providers/speech-to-text/openai-whisper.test.ts +190 -0
package/src/providers/speech-to-text/openai-whisper.ts +68 -0
package/src/providers/speech-to-text/resolve.ts +9 -0
package/src/providers/speech-to-text/types.ts +17 -0
package/src/runtime/auth/route-policy.ts +14 -0
package/src/runtime/auth/token-service.ts +133 -0
package/src/runtime/http-server.ts +4 -2
package/src/runtime/routes/conversation-management-routes.ts +0 -36
package/src/runtime/routes/conversation-query-routes.ts +44 -2
package/src/runtime/routes/conversation-routes.ts +2 -1
package/src/runtime/routes/inbound-message-handler.ts +27 -3
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +16 -1
package/src/runtime/routes/inbound-stages/transcribe-audio.test.ts +287 -0
package/src/runtime/routes/inbound-stages/transcribe-audio.ts +122 -0
package/src/runtime/routes/log-export-routes.ts +1 -0
package/src/runtime/routes/memory-item-routes.test.ts +221 -3
package/src/runtime/routes/memory-item-routes.ts +124 -2
package/src/runtime/routes/secret-routes.ts +4 -1
package/src/runtime/routes/upgrade-broadcast-routes.ts +151 -0
package/src/schedule/schedule-store.ts +0 -21
package/src/security/ces-credential-client.ts +173 -0
package/src/security/secure-keys.ts +65 -22
package/src/signals/bash.ts +3 -0
package/src/signals/cancel.ts +3 -0
package/src/signals/confirm.ts +3 -0
package/src/signals/conversation-undo.ts +3 -0
package/src/signals/event-stream.ts +7 -0
package/src/signals/shotgun.ts +3 -0
package/src/signals/trust-rule.ts +3 -0
package/src/skills/inline-command-render.ts +5 -1
package/src/skills/inline-command-runner.ts +30 -2
package/src/telemetry/usage-telemetry-reporter.test.ts +23 -36
package/src/telemetry/usage-telemetry-reporter.ts +21 -19
package/src/tools/memory/handlers.ts +1 -129
package/src/tools/permission-checker.ts +18 -0
package/src/tools/skills/load.ts +9 -2
package/src/util/device-id.ts +70 -7
package/src/util/logger.ts +35 -9
package/src/util/platform.ts +29 -5
package/src/util/xml.ts +8 -0
package/src/workspace/heartbeat-service.ts +5 -24
package/src/workspace/migrations/migrate-to-workspace-volume.ts +113 -0
package/src/workspace/migrations/registry.ts +2 -0
package/src/__tests__/archive-recall.test.ts +0 -560
package/src/__tests__/conversation-memory-dirty-tail.test.ts +0 -150
package/src/__tests__/conversation-switch-memory-reduction.test.ts +0 -474
package/src/__tests__/db-memory-archive-migration.test.ts +0 -372
package/src/__tests__/db-memory-brief-state-migration.test.ts +0 -213
package/src/__tests__/db-memory-reducer-checkpoints.test.ts +0 -273
package/src/__tests__/memory-brief-open-loops.test.ts +0 -530
package/src/__tests__/memory-brief-time.test.ts +0 -285
package/src/__tests__/memory-brief-wrapper.test.ts +0 -311
package/src/__tests__/memory-chunk-archive.test.ts +0 -400
package/src/__tests__/memory-chunk-dual-write.test.ts +0 -453
package/src/__tests__/memory-episode-archive.test.ts +0 -370
package/src/__tests__/memory-episode-dual-write.test.ts +0 -626
package/src/__tests__/memory-observation-archive.test.ts +0 -375
package/src/__tests__/memory-observation-dual-write.test.ts +0 -318
package/src/__tests__/memory-reducer-job.test.ts +0 -538
package/src/__tests__/memory-reducer-scheduling.test.ts +0 -473
package/src/__tests__/memory-reducer-store.test.ts +0 -728
package/src/__tests__/memory-reducer-types.test.ts +0 -707
package/src/__tests__/memory-reducer.test.ts +0 -704
package/src/__tests__/memory-simplified-config.test.ts +0 -281
package/src/__tests__/simplified-memory-e2e.test.ts +0 -666
package/src/__tests__/simplified-memory-runtime.test.ts +0 -616
package/src/config/schemas/memory-simplified.ts +0 -101
package/src/memory/archive-recall.ts +0 -516
package/src/memory/archive-store.ts +0 -400
package/src/memory/brief-formatting.ts +0 -33
package/src/memory/brief-open-loops.ts +0 -266
package/src/memory/brief-time.ts +0 -162
package/src/memory/brief.ts +0 -75
package/src/memory/job-handlers/backfill-simplified-memory.ts +0 -462
package/src/memory/job-handlers/reduce-conversation-memory.ts +0 -229
package/src/memory/migrations/185-memory-brief-state.ts +0 -52
package/src/memory/migrations/186-memory-archive.ts +0 -109
package/src/memory/migrations/187-memory-reducer-checkpoints.ts +0 -19
package/src/memory/reducer-scheduler.ts +0 -242
package/src/memory/reducer-store.ts +0 -271
package/src/memory/reducer-types.ts +0 -106
package/src/memory/reducer.ts +0 -467
package/src/memory/schema/memory-archive.ts +0 -121
package/src/memory/schema/memory-brief.ts +0 -55

package/src/memory/conversation-crud.ts CHANGED Viewed

@@ -47,18 +47,13 @@ import {
   conversations,
   conversationStarters,
   llmRequestLogs,
-  memoryChunks,
   memoryEmbeddings,
-  memoryEpisodes,
   memoryItems,
   memoryItemSources,
-  memoryObservations,
   memorySegments,
   memorySummaries,
   messageAttachments,
   messages,
-  openLoops,
-  timeContexts,
   toolInvocations,
 } from "./schema.js";
 import { cancelPendingJobsForConversation } from "./task-memory-cleanup.js";
@@ -177,9 +172,6 @@ export interface ConversationRow {
   forkParentMessageId: string | null;
   isAutoTitle: number;
   scheduleJobId: string | null;
-  memoryReducedThroughMessageId: string | null;
-  memoryDirtyTailSinceMessageId: string | null;
-  memoryLastReducedAt: number | null;
 }
 export const parseConversation = createRowMapper<
@@ -205,9 +197,6 @@ export const parseConversation = createRowMapper<
   forkParentMessageId: "forkParentMessageId",
   isAutoTitle: "isAutoTitle",
   scheduleJobId: "scheduleJobId",
-  memoryReducedThroughMessageId: "memoryReducedThroughMessageId",
-  memoryDirtyTailSinceMessageId: "memoryDirtyTailSinceMessageId",
-  memoryLastReducedAt: "memoryLastReducedAt",
 });
 export interface MessageRow {
@@ -555,9 +544,6 @@ export function deleteConversation(id: string): DeletedMemoryIds {
     segmentIds: [],
     orphanedItemIds: [],
     deletedSummaryIds: [],
-    deletedObservationIds: [],
-    deletedChunkIds: [],
-    deletedEpisodeIds: [],
   };
   // Capture createdAt before the transaction deletes the row — needed to
@@ -711,75 +697,6 @@ export function deleteConversation(id: string): DeletedMemoryIds {
       tx.delete(conversationStarters)
         .where(eq(conversationStarters.scopeId, memoryScopeId))
         .run();
-      // Sweep brief-state tables scoped to this private conversation.
-      tx.delete(timeContexts)
-        .where(eq(timeContexts.scopeId, memoryScopeId))
-        .run();
-      tx.delete(openLoops).where(eq(openLoops.scopeId, memoryScopeId)).run();
-    }
-    // Collect archive table IDs before the cascade delete removes them.
-    // Observations and episodes reference conversations with ON DELETE CASCADE,
-    // and chunks cascade from observations.
-    const observationRows = tx
-      .select({ id: memoryObservations.id })
-      .from(memoryObservations)
-      .where(eq(memoryObservations.conversationId, id))
-      .all();
-    const observationIds = observationRows.map((r) => r.id);
-    if (observationIds.length > 0) {
-      // Collect chunk IDs before observations cascade-delete them.
-      const chunkRows = tx
-        .select({ id: memoryChunks.id })
-        .from(memoryChunks)
-        .where(inArray(memoryChunks.observationId, observationIds))
-        .all();
-      const chunkIds = chunkRows.map((r) => r.id);
-      // Clean up embeddings for chunks.
-      if (chunkIds.length > 0) {
-        tx.delete(memoryEmbeddings)
-          .where(
-            and(
-              eq(memoryEmbeddings.targetType, "chunk"),
-              inArray(memoryEmbeddings.targetId, chunkIds),
-            ),
-          )
-          .run();
-        result.deletedChunkIds.push(...chunkIds);
-      }
-      // Clean up embeddings for observations.
-      tx.delete(memoryEmbeddings)
-        .where(
-          and(
-            eq(memoryEmbeddings.targetType, "observation"),
-            inArray(memoryEmbeddings.targetId, observationIds),
-          ),
-        )
-        .run();
-      result.deletedObservationIds.push(...observationIds);
-    }
-    const episodeRows = tx
-      .select({ id: memoryEpisodes.id })
-      .from(memoryEpisodes)
-      .where(eq(memoryEpisodes.conversationId, id))
-      .all();
-    const episodeIds = episodeRows.map((r) => r.id);
-    if (episodeIds.length > 0) {
-      tx.delete(memoryEmbeddings)
-        .where(
-          and(
-            eq(memoryEmbeddings.targetType, "episode"),
-            inArray(memoryEmbeddings.targetId, episodeIds),
-          ),
-        )
-        .run();
-      result.deletedEpisodeIds.push(...episodeIds);
     }
     tx.delete(conversations).where(eq(conversations.id, id)).run();
@@ -1005,9 +922,6 @@ export function purgePrivateConversations(): {
         segmentIds: [],
         orphanedItemIds: [],
         deletedSummaryIds: [],
-        deletedObservationIds: [],
-        deletedChunkIds: [],
-        deletedEpisodeIds: [],
       },
     };
   }
@@ -1015,18 +929,12 @@ export function purgePrivateConversations(): {
   const allSegmentIds: string[] = [];
   const allOrphanedItemIds: string[] = [];
   const allDeletedSummaryIds: string[] = [];
-  const allDeletedObservationIds: string[] = [];
-  const allDeletedChunkIds: string[] = [];
-  const allDeletedEpisodeIds: string[] = [];
   for (const conv of privateConvs) {
     const deleted = deleteConversation(conv.id);
     allSegmentIds.push(...deleted.segmentIds);
     allOrphanedItemIds.push(...deleted.orphanedItemIds);
     allDeletedSummaryIds.push(...deleted.deletedSummaryIds);
-    allDeletedObservationIds.push(...deleted.deletedObservationIds);
-    allDeletedChunkIds.push(...deleted.deletedChunkIds);
-    allDeletedEpisodeIds.push(...deleted.deletedEpisodeIds);
   }
   return {
@@ -1035,9 +943,6 @@ export function purgePrivateConversations(): {
       segmentIds: allSegmentIds,
       orphanedItemIds: allOrphanedItemIds,
       deletedSummaryIds: allDeletedSummaryIds,
-      deletedObservationIds: allDeletedObservationIds,
-      deletedChunkIds: allDeletedChunkIds,
-      deletedEpisodeIds: allDeletedEpisodeIds,
     },
   };
 }
@@ -1120,13 +1025,6 @@ export async function addMessage(
       throw err;
     }
   }
-  // Mark the conversation dirty for delayed memory reduction. This runs
-  // after the insert transaction succeeds so the reducer knows which
-  // conversations have unprocessed messages. The helper preserves the
-  // earliest unreduced boundary (no-op when already dirty).
-  markConversationMemoryDirty(conversationId, messageId);
   const message = {
     id: messageId,
     conversationId,
@@ -1431,9 +1329,6 @@ export interface DeletedMemoryIds {
   segmentIds: string[];
   orphanedItemIds: string[];
   deletedSummaryIds: string[];
-  deletedObservationIds: string[];
-  deletedChunkIds: string[];
-  deletedEpisodeIds: string[];
 }
 export interface WipeConversationResult extends DeletedMemoryIds {
@@ -1507,9 +1402,6 @@ export function deleteMessageById(messageId: string): DeletedMemoryIds {
     segmentIds: [],
     orphanedItemIds: [],
     deletedSummaryIds: [],
-    deletedObservationIds: [],
-    deletedChunkIds: [],
-    deletedEpisodeIds: [],
   };
   // Collect attachment IDs linked to this message before cascade-delete
@@ -1598,134 +1490,6 @@ export function deleteMessageById(messageId: string): DeletedMemoryIds {
   return result;
 }
-/**
- * Mark a conversation as having unreduced messages starting from the given
- * message. Sets `memoryDirtyTailSinceMessageId` only when it is currently
- * null so the earliest unreduced boundary is preserved across multiple
- * messages — later messages must not clobber the original dirty marker.
- *
- * Also upserts a pending `reduce_conversation_memory` job scheduled at
- * `now + idleDelayMs`. If a pending job for this conversation already exists,
- * its `runAfter` is pushed forward (rescheduled) so the reducer waits for
- * the full idle window after the *latest* message — avoiding premature runs
- * while the user is still actively typing.
- */
-export function markConversationMemoryDirty(
-  conversationId: string,
-  messageId: string,
-): void {
-  const db = getDb();
-  db.update(conversations)
-    .set({ memoryDirtyTailSinceMessageId: messageId })
-    .where(
-      and(
-        eq(conversations.id, conversationId),
-        isNull(conversations.memoryDirtyTailSinceMessageId),
-      ),
-    )
-    .run();
-  // Schedule (or reschedule) a deferred reducer job for this conversation.
-  scheduleReducerJob(conversationId);
-}
-/**
- * Upsert a pending `reduce_conversation_memory` job for the given
- * conversation, scheduled `idleDelayMs` from now. If one already exists in
- * pending state, its `runAfter` is pushed forward to restart the idle timer.
- * This ensures exactly one pending reducer job per conversation — new
- * messages reschedule rather than duplicate.
- */
-export function scheduleReducerJob(
-  conversationId: string,
-  runAfter?: number,
-): void {
-  const idleDelayMs = getReducerIdleDelayMs();
-  const scheduledAt = runAfter ?? Date.now() + idleDelayMs;
-  const existing = rawGet<{ id: string; status: string }>(
-    `SELECT id, status FROM memory_jobs
-     WHERE type = 'reduce_conversation_memory'
-       AND json_extract(payload, '$.conversationId') = ?
-       AND status = 'pending'
-     LIMIT 1`,
-    conversationId,
-  );
-  if (existing) {
-    // Reschedule: push runAfter forward so the idle timer resets.
-    rawRun(
-      `UPDATE memory_jobs SET run_after = ?, updated_at = ? WHERE id = ?`,
-      scheduledAt,
-      Date.now(),
-      existing.id,
-    );
-  } else {
-    enqueueMemoryJob(
-      "reduce_conversation_memory",
-      { conversationId },
-      scheduledAt,
-    );
-  }
-}
-/**
- * Startup sweep: find conversations that are marked dirty and whose tail
- * message is already older than the idle delay. For these conversations the
- * reducer should have run but didn't (daemon was down). Enqueue immediate
- * reducer jobs for each so they are processed on the next worker tick.
- *
- * Conversations whose tail is still within the idle window are skipped —
- * the normal `markConversationMemoryDirty` path will schedule them when
- * new messages arrive (or on the next conversation interaction).
- *
- * Returns the number of jobs enqueued.
- */
-export function sweepStaleReducerJobs(): number {
-  const idleDelayMs = getReducerIdleDelayMs();
-  const cutoff = Date.now() - idleDelayMs;
-  // Find dirty conversations whose latest message is older than the idle
-  // window AND that don't already have a pending reducer job.
-  const stale = rawAll<{ conversationId: string }>(
-    `SELECT c.id AS conversationId
-     FROM conversations c
-     WHERE c.memory_dirty_tail_since_message_id IS NOT NULL
-       AND NOT EXISTS (
-         SELECT 1 FROM memory_jobs mj
-         WHERE mj.type = 'reduce_conversation_memory'
-           AND json_extract(mj.payload, '$.conversationId') = c.id
-           AND mj.status IN ('pending', 'running')
-       )
-       AND (
-         SELECT MAX(m.created_at) FROM messages m
-         WHERE m.conversation_id = c.id
-       ) <= ?`,
-    cutoff,
-  );
-  for (const { conversationId } of stale) {
-    enqueueMemoryJob("reduce_conversation_memory", { conversationId });
-  }
-  return stale.length;
-}
-function getReducerIdleDelayMs(): number {
-  // Some test suites mock getConfig() with partial objects; fall back to the
-  // schema default so reducer scheduling stays stable outside full config load.
-  const config = getConfig() as {
-    memory?: {
-      simplified?: {
-        reducer?: {
-          idleDelayMs?: number;
-        };
-      };
-    };
-  };
-  return config.memory?.simplified?.reducer?.idleDelayMs ?? 30_000;
-}
 export function setConversationOriginChannelIfUnset(
   conversationId: string,
   channel: ChannelId,

package/src/memory/conversation-title-service.ts CHANGED Viewed

@@ -133,6 +133,8 @@ export async function generateAndPersistConversationTitle(
   const result = await runBtwSidechain({
     content: prompt,
     provider,
+    systemPrompt: buildTitleSystemPrompt(),
+    tools: [],
     maxTokens: config.daemon.titleGenerationMaxTokens,
     modelIntent: "latency-optimized",
     signal,
@@ -236,6 +238,8 @@ export async function regenerateConversationTitle(
   const result = await runBtwSidechain({
     content: prompt,
     provider,
+    systemPrompt: buildTitleSystemPrompt(),
+    tools: [],
     maxTokens: config.daemon.titleGenerationMaxTokens,
     modelIntent: "latency-optimized",
     signal,
@@ -277,14 +281,30 @@ export function queueRegenerateConversationTitle(
 // ── Internal helpers ─────────────────────────────────────────────────
+/**
+ * Dedicated system prompt for title generation. Replaces the default
+ * assistant system prompt that btw-sidechain would otherwise inject,
+ * which caused the model to respond to the conversation content instead
+ * of titling it.
+ */
+function buildTitleSystemPrompt(): string {
+  return [
+    "You generate short conversation titles. Output ONLY the title text — no explanation, no quotes, no markdown, no preamble.",
+    "",
+    "Rules:",
+    "- Maximum 5 words and 40 characters",
+    "- Summarize the TOPIC the user is asking about",
+    "- Do NOT respond to the conversation content",
+    "- Do NOT assess feasibility or comment on capabilities",
+  ].join("\n");
+}
 function buildTitlePrompt(
   context?: TitleContext,
   userMessage?: string,
   assistantResponse?: string,
 ): string {
-  const parts: string[] = [
-    "Generate a very short title summarizing the TOPIC of this conversation. Rules: at most 5 words, at most 40 characters, no quotes, no markdown formatting. IMPORTANT: Summarize what the user is asking about — do NOT respond to the message, do NOT assess feasibility, and do NOT comment on your own capabilities.",
-  ];
+  const parts: string[] = [];
   if (context) {
     const hints: string[] = [];
@@ -295,12 +315,12 @@ function buildTitlePrompt(
     if (context.metadataHints?.length)
       hints.push(`Hints: ${context.metadataHints.join(", ")}`);
     if (hints.length > 0) {
-      parts.push("", "Metadata:", ...hints);
+      parts.push("Metadata:", ...hints, "");
     }
   }
   if (userMessage) {
-    parts.push("", `User: ${truncate(userMessage, 200, "")}`);
+    parts.push(`User: ${truncate(userMessage, 200, "")}`);
   }
   if (assistantResponse) {
     parts.push(`Assistant: ${truncate(assistantResponse, 200, "")}`);
@@ -339,11 +359,7 @@ function deriveFallbackTitle(context?: TitleContext): string | null {
 }
 function buildRegenerationPrompt(recentMessages: MessageRow[]): string {
-  const parts: string[] = [
-    "Generate a very short title summarizing the TOPIC of this conversation based on the recent messages below. Rules: at most 5 words, at most 40 characters, no quotes, no markdown formatting. IMPORTANT: Summarize what the user is asking about — do NOT respond to the messages, do NOT assess feasibility, and do NOT comment on your own capabilities.",
-    "",
-    "Recent messages:",
-  ];
+  const parts: string[] = ["Recent messages:"];
   for (const msg of recentMessages) {
     const role = msg.role === "user" ? "User" : "Assistant";

package/src/memory/db-init.ts CHANGED Viewed

@@ -66,6 +66,7 @@ import {
   migrateDropMemorySegmentFts,
   migrateDropOrphanedMediaTables,
   migrateDropRemindersTable,
+  migrateDropSimplifiedMemory,
   migrateDropUsageCompositeIndexes,
   migrateFkCascadeRebuilds,
   migrateGuardianActionFollowup,
@@ -82,10 +83,7 @@ import {
   migrateInviteContactId,
   migrateLlmRequestLogMessageId,
   migrateLlmRequestLogProvider,
-  migrateMemoryArchiveTables,
-  migrateMemoryBriefState,
   migrateMemoryItemSupersession,
-  migrateMemoryReducerCheckpoints,
   migrateMessagesFtsBackfill,
   migrateNormalizePhoneIdentities,
   migrateNotificationDeliveryThreadDecision,
@@ -488,18 +486,12 @@ export function initializeDb(): void {
   // 84. Add nullable conversation fork lineage columns and parent lookup index
   migrateConversationForkLineage(database);
-  // 85. Memory brief state tables (time_contexts, open_loops) for simplified memory system
-  migrateMemoryBriefState(database);
-  // 86. Memory archive tables (observations, chunks, episodes) for simplified memory v1
-  migrateMemoryArchiveTables(database);
-  // 87. Add memory reducer checkpoint columns to conversations
-  migrateMemoryReducerCheckpoints(database);
-  // 88. Add quiet flag to schedule jobs
+  // 85. Add quiet flag to schedule jobs
   migrateScheduleQuietFlag(database);
+  // 86. Drop simplified-memory tables and reducer checkpoint columns
+  migrateDropSimplifiedMemory(database);
   validateMigrationState(database);
   if (process.env.BUN_TEST === "1") {

package/src/memory/embedding-local.ts CHANGED Viewed

@@ -1,6 +1,7 @@
 import { existsSync, unlinkSync, writeFileSync } from "node:fs";
 import { join } from "node:path";
+import { getIsContainerized } from "../config/env-registry.js";
 import { getLogger } from "../util/logger.js";
 import { getEmbeddingModelsDir, getRootDir } from "../util/platform.js";
 import { PromiseGuard } from "../util/promise-guard.js";
@@ -353,12 +354,17 @@ export class LocalEmbeddingBackend implements EmbeddingBackend {
   private static readonly PID_FILENAME = "embed-worker.pid";
+  /** PID files are process-local state — store in /tmp when containerized to keep shared volumes clean. */
+  private getPidFilePath(): string {
+    if (getIsContainerized()) {
+      return join("/tmp", LocalEmbeddingBackend.PID_FILENAME);
+    }
+    return join(getRootDir(), LocalEmbeddingBackend.PID_FILENAME);
+  }
   private writePidFile(pid: number): void {
     try {
-      writeFileSync(
-        join(getRootDir(), LocalEmbeddingBackend.PID_FILENAME),
-        String(pid),
-      );
+      writeFileSync(this.getPidFilePath(), String(pid));
     } catch {
       // Best-effort — doesn't affect functionality
     }
@@ -366,7 +372,7 @@ export class LocalEmbeddingBackend implements EmbeddingBackend {
   private removePidFile(): void {
     try {
-      unlinkSync(join(getRootDir(), LocalEmbeddingBackend.PID_FILENAME));
+      unlinkSync(this.getPidFilePath());
     } catch {
       // Best-effort
     }

package/src/memory/indexer.ts CHANGED Viewed

@@ -5,7 +5,6 @@ import { getConfig } from "../config/loader.js";
 import type { MemoryConfig } from "../config/types.js";
 import type { TrustClass } from "../runtime/actor-trust-resolver.js";
 import { getLogger } from "../util/logger.js";
-import { computeChunkContentHash } from "./archive-store.js";
 import { getDb } from "./db.js";
 import { selectedBackendSupportsMultimodal } from "./embedding-backend.js";
 import { enqueueMemoryJob } from "./jobs-store.js";
@@ -13,7 +12,7 @@ import {
   extractMediaBlockMeta,
   extractTextFromStoredMessageContent,
 } from "./message-content.js";
-import { memoryChunks, memoryObservations, memorySegments } from "./schema.js";
+import { memorySegments } from "./schema.js";
 import { segmentText } from "./segmenter.js";
 const log = getLogger("memory-indexer");
@@ -54,12 +53,7 @@ export async function indexMessageNow(
     input.provenanceTrustClass === undefined;
   const text = extractTextFromStoredMessageContent(input.content);
-  const hasText = text.length > 0;
-  const candidateMediaMeta = extractMediaBlockMeta(input.content).filter(
-    (b) => b.type === "image",
-  );
-  const hasMedia = candidateMediaMeta.length > 0;
-  if (!hasText && !hasMedia) {
+  if (text.length === 0) {
     enqueueMemoryJob("build_conversation_summary", {
       conversationId: input.conversationId,
     });
@@ -68,13 +62,11 @@ export async function indexMessageNow(
   const db = getDb();
   const now = Date.now();
-  const segments = hasText
-    ? segmentText(
-        text,
-        config.segmentation.targetTokens,
-        config.segmentation.overlapTokens,
-      )
-    : [];
+  const segments = segmentText(
+    text,
+    config.segmentation.targetTokens,
+    config.segmentation.overlapTokens,
+  );
   const shouldExtract =
     input.role === "user" ||
     (input.role === "assistant" && config.extraction.extractFromAssistant);
@@ -84,6 +76,9 @@ export async function indexMessageNow(
   // overhead for messages on non-multimodal backends.
   // selectedBackendSupportsMultimodal requires async key resolution, so we
   // skip it entirely for text-only messages.
+  const candidateMediaMeta = extractMediaBlockMeta(input.content).filter(
+    (b) => b.type === "image",
+  );
   const mediaBlocks =
     candidateMediaMeta.length > 0 &&
     (await selectedBackendSupportsMultimodal(getConfig()))
@@ -93,10 +88,7 @@ export async function indexMessageNow(
   // Wrap all segment inserts and job enqueues in a single transaction so they
   // either all succeed or all roll back, preventing partial/orphaned state.
   let skippedEmbedJobs = 0;
-  let skippedChunkEmbedJobs = 0;
-  const scopeId = input.scopeId ?? "default";
   db.transaction((tx) => {
-    // ── Legacy segment path (kept intact for parallel validation) ───
     for (const segment of segments) {
       const segmentId = buildSegmentId(input.messageId, segment.segmentIndex);
       const hash = createHash("sha256").update(segment.text).digest("hex");
@@ -117,7 +109,7 @@ export async function indexMessageNow(
           segmentIndex: segment.segmentIndex,
           text: segment.text,
           tokenEstimate: segment.tokenEstimate,
-          scopeId,
+          scopeId: input.scopeId ?? "default",
           contentHash: hash,
           createdAt: input.createdAt,
           updatedAt: now,
@@ -127,7 +119,7 @@ export async function indexMessageNow(
           set: {
             text: segment.text,
             tokenEstimate: segment.tokenEstimate,
-            scopeId,
+            scopeId: input.scopeId ?? "default",
             contentHash: hash,
             updatedAt: now,
           },
@@ -141,65 +133,6 @@ export async function indexMessageNow(
       }
     }
-    // ── Archive chunk dual-write (mirrors segment boundaries) ──────
-    // Create a single observation per message, then create one chunk per
-    // segment using the same segmentation boundaries. Chunks are
-    // deduplicated by (scopeId, contentHash) via onConflictDoNothing so
-    // unchanged content does not enqueue duplicate embed_chunk jobs.
-    const observationId = buildObservationId(input.messageId);
-    tx.insert(memoryObservations)
-      .values({
-        id: observationId,
-        scopeId,
-        conversationId: input.conversationId,
-        messageId: input.messageId,
-        role: input.role,
-        content: hasText ? text : input.content,
-        modality: hasMedia ? "multimodal" : "text",
-        source: null,
-        createdAt: input.createdAt,
-      })
-      .onConflictDoNothing({ target: memoryObservations.id })
-      .run();
-    for (const segment of segments) {
-      const chunkId = buildChunkId(input.messageId, segment.segmentIndex);
-      const chunkHash = computeChunkContentHash(scopeId, segment.text);
-      // Check if this chunk already exists with the same content hash
-      const existingChunk = tx
-        .select({ contentHash: memoryChunks.contentHash })
-        .from(memoryChunks)
-        .where(eq(memoryChunks.id, chunkId))
-        .get();
-      tx.insert(memoryChunks)
-        .values({
-          id: chunkId,
-          scopeId,
-          observationId,
-          content: segment.text,
-          tokenEstimate: segment.tokenEstimate,
-          contentHash: chunkHash,
-          createdAt: input.createdAt,
-        })
-        .onConflictDoUpdate({
-          target: memoryChunks.id,
-          set: {
-            content: segment.text,
-            tokenEstimate: segment.tokenEstimate,
-            contentHash: chunkHash,
-          },
-        })
-        .run();
-      if (existingChunk?.contentHash === chunkHash) {
-        skippedChunkEmbedJobs++;
-      } else {
-        enqueueMemoryJob("embed_chunk", { chunkId, scopeId }, Date.now(), tx);
-      }
-    }
     // Enqueue embed_attachment jobs for image content blocks when the
     // embedding provider supports multimodal (Gemini only).
     for (const block of mediaBlocks) {
@@ -214,7 +147,7 @@ export async function indexMessageNow(
     if (shouldExtract && isTrustedActor && !input.automated) {
       enqueueMemoryJob(
         "extract_items",
-        { messageId: input.messageId, scopeId },
+        { messageId: input.messageId, scopeId: input.scopeId ?? "default" },
         Date.now(),
         tx,
       );
@@ -233,12 +166,6 @@ export async function indexMessageNow(
     );
   }
-  if (skippedChunkEmbedJobs > 0) {
-    log.debug(
-      `Skipped ${skippedChunkEmbedJobs}/${segments.length} embed_chunk jobs (content unchanged)`,
-    );
-  }
   if (!isTrustedActor && shouldExtract) {
     log.info(
       `Skipping extraction jobs for untrusted actor (trustClass=${input.provenanceTrustClass})`,
@@ -250,11 +177,9 @@ export async function indexMessageNow(
   }
   const extractionGated = !isTrustedActor || !!input.automated;
-  const segmentEmbedJobs = segments.length - skippedEmbedJobs;
-  const chunkEmbedJobs = segments.length - skippedChunkEmbedJobs;
   const enqueuedJobs =
-    segmentEmbedJobs +
-    chunkEmbedJobs +
+    segments.length -
+    skippedEmbedJobs +
     mediaBlocks.length +
     (shouldExtract && !extractionGated ? 2 : 1);
   return {
@@ -288,19 +213,3 @@ export function getRecentSegmentsForConversation(
 function buildSegmentId(messageId: string, segmentIndex: number): string {
   return `${messageId}:${segmentIndex}`;
 }
-/**
- * Deterministic observation ID derived from the messageId so repeated
- * indexer runs for the same message converge on the same observation row.
- */
-function buildObservationId(messageId: string): string {
-  return `obs:${messageId}`;
-}
-/**
- * Deterministic chunk ID derived from the messageId and segment index so
- * the dual-write path mirrors the legacy segment identity scheme exactly.
- */
-function buildChunkId(messageId: string, segmentIndex: number): string {
-  return `chunk:${messageId}:${segmentIndex}`;
-}