npm - @vellumai/assistant - Versions diffs - 0.4.49 → 0.4.50 - Mend

@vellumai/assistant 0.4.49 → 0.4.50

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (239) hide show

package/ARCHITECTURE.md +24 -33
package/README.md +3 -3
package/docs/architecture/memory.md +180 -119
package/package.json +2 -2
package/src/__tests__/agent-loop.test.ts +3 -1
package/src/__tests__/anthropic-provider.test.ts +114 -23
package/src/__tests__/approval-cascade.test.ts +1 -15
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-feature-flag-guard.test.ts +0 -23
package/src/__tests__/canonical-guardian-store.test.ts +95 -0
package/src/__tests__/checker.test.ts +13 -0
package/src/__tests__/config-schema.test.ts +1 -68
package/src/__tests__/context-memory-e2e.test.ts +11 -100
package/src/__tests__/conversation-routes-guardian-reply.test.ts +8 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-security-e2e.test.ts +1 -0
package/src/__tests__/credential-vault-unit.test.ts +4 -0
package/src/__tests__/credential-vault.test.ts +13 -1
package/src/__tests__/cu-unified-flow.test.ts +532 -0
package/src/__tests__/date-context.test.ts +93 -77
package/src/__tests__/deterministic-verification-control-plane.test.ts +64 -0
package/src/__tests__/guardian-routing-invariants.test.ts +93 -0
package/src/__tests__/history-repair.test.ts +245 -0
package/src/__tests__/host-cu-proxy.test.ts +165 -3
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/invite-redemption-service.test.ts +65 -1
package/src/__tests__/keychain-broker-client.test.ts +4 -4
package/src/__tests__/memory-context-benchmark.benchmark.test.ts +56 -18
package/src/__tests__/memory-lifecycle-e2e.test.ts +244 -387
package/src/__tests__/memory-recall-quality.test.ts +244 -407
package/src/__tests__/memory-regressions.experimental.test.ts +126 -101
package/src/__tests__/memory-regressions.test.ts +477 -2841
package/src/__tests__/memory-retrieval.benchmark.test.ts +33 -150
package/src/__tests__/memory-upsert-concurrency.test.ts +5 -244
package/src/__tests__/mime-builder.test.ts +28 -0
package/src/__tests__/native-web-search.test.ts +1 -0
package/src/__tests__/oauth-cli.test.ts +572 -5
package/src/__tests__/oauth-store.test.ts +120 -6
package/src/__tests__/qdrant-collection-migration.test.ts +53 -8
package/src/__tests__/registry.test.ts +0 -1
package/src/__tests__/relay-server.test.ts +46 -1
package/src/__tests__/schedule-tools.test.ts +32 -0
package/src/__tests__/script-proxy-certs.test.ts +1 -1
package/src/__tests__/secret-onetime-send.test.ts +1 -0
package/src/__tests__/secure-keys.test.ts +7 -2
package/src/__tests__/send-endpoint-busy.test.ts +3 -0
package/src/__tests__/session-abort-tool-results.test.ts +1 -14
package/src/__tests__/session-agent-loop-overflow.test.ts +1583 -0
package/src/__tests__/session-agent-loop.test.ts +19 -15
package/src/__tests__/session-confirmation-signals.test.ts +1 -15
package/src/__tests__/session-error.test.ts +124 -2
package/src/__tests__/session-history-web-search.test.ts +918 -0
package/src/__tests__/session-pre-run-repair.test.ts +1 -14
package/src/__tests__/session-provider-retry-repair.test.ts +25 -28
package/src/__tests__/session-queue.test.ts +37 -27
package/src/__tests__/session-runtime-assembly.test.ts +54 -0
package/src/__tests__/session-slash-known.test.ts +1 -15
package/src/__tests__/session-slash-queue.test.ts +1 -15
package/src/__tests__/session-slash-unknown.test.ts +1 -15
package/src/__tests__/session-workspace-cache-state.test.ts +3 -33
package/src/__tests__/session-workspace-injection.test.ts +3 -37
package/src/__tests__/session-workspace-tool-tracking.test.ts +3 -37
package/src/__tests__/skills-install-extract.test.ts +93 -0
package/src/__tests__/skillssh-registry.test.ts +451 -0
package/src/__tests__/trust-store.test.ts +15 -0
package/src/__tests__/voice-invite-redemption.test.ts +32 -1
package/src/agent/ax-tree-compaction.test.ts +51 -0
package/src/agent/loop.ts +39 -12
package/src/approvals/AGENTS.md +1 -1
package/src/approvals/guardian-request-resolvers.ts +14 -2
package/src/bundler/compiler-tools.ts +66 -2
package/src/calls/call-domain.ts +132 -0
package/src/calls/call-store.ts +6 -0
package/src/calls/relay-server.ts +43 -5
package/src/calls/relay-setup-router.ts +17 -1
package/src/calls/twilio-config.ts +1 -1
package/src/calls/types.ts +3 -1
package/src/cli/commands/doctor.ts +4 -3
package/src/cli/commands/mcp.ts +46 -59
package/src/cli/commands/memory.ts +16 -165
package/src/cli/commands/oauth/apps.ts +31 -2
package/src/cli/commands/oauth/connections.ts +431 -97
package/src/cli/commands/oauth/providers.ts +15 -1
package/src/cli/commands/sessions.ts +5 -2
package/src/cli/commands/skills.ts +173 -1
package/src/cli/http-client.ts +0 -20
package/src/cli/main-screen.tsx +2 -2
package/src/cli/program.ts +5 -6
package/src/cli.ts +4 -10
package/src/config/bundled-skills/computer-use/TOOLS.json +1 -1
package/src/config/bundled-skills/computer-use/tools/computer-use-observe.ts +12 -0
package/src/config/bundled-tool-registry.ts +2 -5
package/src/config/schema.ts +1 -12
package/src/config/schemas/memory-lifecycle.ts +0 -9
package/src/config/schemas/memory-processing.ts +0 -180
package/src/config/schemas/memory-retrieval.ts +32 -104
package/src/config/schemas/memory.ts +0 -10
package/src/config/types.ts +0 -4
package/src/context/window-manager.ts +4 -1
package/src/daemon/config-watcher.ts +61 -3
package/src/daemon/daemon-control.ts +1 -1
package/src/daemon/date-context.ts +114 -31
package/src/daemon/handlers/sessions.ts +18 -13
package/src/daemon/handlers/skills.ts +20 -1
package/src/daemon/history-repair.ts +72 -8
package/src/daemon/host-cu-proxy.ts +55 -26
package/src/daemon/lifecycle.ts +31 -3
package/src/daemon/mcp-reload-service.ts +2 -2
package/src/daemon/message-types/computer-use.ts +1 -12
package/src/daemon/message-types/memory.ts +4 -16
package/src/daemon/message-types/messages.ts +1 -0
package/src/daemon/message-types/sessions.ts +4 -0
package/src/daemon/server.ts +12 -1
package/src/daemon/session-agent-loop-handlers.ts +38 -0
package/src/daemon/session-agent-loop.ts +334 -48
package/src/daemon/session-error.ts +89 -6
package/src/daemon/session-history.ts +17 -7
package/src/daemon/session-media-retry.ts +6 -2
package/src/daemon/session-memory.ts +69 -149
package/src/daemon/session-process.ts +10 -1
package/src/daemon/session-runtime-assembly.ts +49 -19
package/src/daemon/session-surfaces.ts +4 -1
package/src/daemon/session-tool-setup.ts +7 -1
package/src/daemon/session.ts +12 -2
package/src/instrument.ts +61 -1
package/src/memory/admin.ts +2 -191
package/src/memory/canonical-guardian-store.ts +38 -2
package/src/memory/conversation-crud.ts +0 -33
package/src/memory/conversation-queries.ts +22 -3
package/src/memory/db-init.ts +28 -0
package/src/memory/embedding-backend.ts +84 -8
package/src/memory/embedding-types.ts +9 -1
package/src/memory/indexer.ts +7 -46
package/src/memory/items-extractor.ts +274 -76
package/src/memory/job-handlers/backfill.ts +2 -127
package/src/memory/job-handlers/cleanup.ts +2 -16
package/src/memory/job-handlers/extraction.ts +2 -138
package/src/memory/job-handlers/index-maintenance.ts +1 -6
package/src/memory/job-handlers/summarization.ts +3 -148
package/src/memory/job-utils.ts +21 -59
package/src/memory/jobs-store.ts +1 -159
package/src/memory/jobs-worker.ts +9 -52
package/src/memory/migrations/104-core-indexes.ts +3 -3
package/src/memory/migrations/149-oauth-tables.ts +2 -0
package/src/memory/migrations/150-oauth-apps-client-secret-path.ts +98 -0
package/src/memory/migrations/151-oauth-providers-ping-url.ts +11 -0
package/src/memory/migrations/152-memory-item-supersession.ts +44 -0
package/src/memory/migrations/153-drop-entity-tables.ts +15 -0
package/src/memory/migrations/154-drop-fts.ts +20 -0
package/src/memory/migrations/155-drop-conflicts.ts +7 -0
package/src/memory/migrations/156-call-session-invite-metadata.ts +24 -0
package/src/memory/migrations/index.ts +7 -0
package/src/memory/qdrant-client.ts +148 -51
package/src/memory/raw-query.ts +1 -1
package/src/memory/retriever.test.ts +294 -273
package/src/memory/retriever.ts +421 -645
package/src/memory/schema/calls.ts +2 -0
package/src/memory/schema/memory-core.ts +3 -48
package/src/memory/schema/oauth.ts +2 -0
package/src/memory/search/formatting.ts +263 -176
package/src/memory/search/lexical.ts +1 -254
package/src/memory/search/ranking.ts +0 -455
package/src/memory/search/semantic.ts +100 -14
package/src/memory/search/staleness.ts +47 -0
package/src/memory/search/tier-classifier.ts +21 -0
package/src/memory/search/types.ts +15 -77
package/src/memory/task-memory-cleanup.ts +4 -6
package/src/messaging/providers/gmail/mime-builder.ts +17 -7
package/src/oauth/byo-connection.test.ts +8 -1
package/src/oauth/oauth-store.ts +113 -27
package/src/oauth/seed-providers.ts +6 -0
package/src/oauth/token-persistence.ts +11 -3
package/src/permissions/defaults.ts +1 -0
package/src/permissions/trust-store.ts +23 -1
package/src/playbooks/playbook-compiler.ts +1 -1
package/src/prompts/system-prompt.ts +18 -2
package/src/providers/anthropic/client.ts +56 -126
package/src/providers/types.ts +7 -1
package/src/runtime/AGENTS.md +9 -0
package/src/runtime/auth/route-policy.ts +6 -3
package/src/runtime/guardian-reply-router.ts +24 -22
package/src/runtime/http-server.ts +2 -2
package/src/runtime/invite-redemption-service.ts +19 -1
package/src/runtime/invite-service.ts +25 -0
package/src/runtime/pending-interactions.ts +2 -2
package/src/runtime/routes/brain-graph-routes.ts +10 -90
package/src/runtime/routes/conversation-routes.ts +9 -1
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +21 -12
package/src/runtime/routes/memory-item-routes.test.ts +754 -0
package/src/runtime/routes/memory-item-routes.ts +503 -0
package/src/runtime/routes/session-management-routes.ts +3 -3
package/src/runtime/routes/settings-routes.ts +2 -2
package/src/runtime/routes/trust-rules-routes.ts +14 -0
package/src/runtime/routes/workspace-routes.ts +2 -1
package/src/security/keychain-broker-client.ts +17 -4
package/src/security/secure-keys.ts +25 -3
package/src/security/token-manager.ts +36 -36
package/src/skills/catalog-install.ts +74 -18
package/src/skills/skillssh-registry.ts +503 -0
package/src/tools/assets/search.ts +5 -1
package/src/tools/computer-use/definitions.ts +0 -10
package/src/tools/computer-use/registry.ts +1 -1
package/src/tools/credentials/vault.ts +1 -3
package/src/tools/memory/definitions.ts +4 -13
package/src/tools/memory/handlers.test.ts +83 -103
package/src/tools/memory/handlers.ts +50 -85
package/src/tools/schedule/create.ts +8 -1
package/src/tools/schedule/update.ts +8 -1
package/src/tools/skills/load.ts +25 -2
package/src/__tests__/clarification-resolver.test.ts +0 -193
package/src/__tests__/conflict-intent-tokenization.test.ts +0 -160
package/src/__tests__/conflict-policy.test.ts +0 -269
package/src/__tests__/conflict-store.test.ts +0 -372
package/src/__tests__/contradiction-checker.test.ts +0 -361
package/src/__tests__/entity-extractor.test.ts +0 -211
package/src/__tests__/entity-search.test.ts +0 -1117
package/src/__tests__/profile-compiler.test.ts +0 -392
package/src/__tests__/session-conflict-gate.test.ts +0 -1228
package/src/__tests__/session-profile-injection.test.ts +0 -557
package/src/config/bundled-skills/knowledge-graph/SKILL.md +0 -25
package/src/config/bundled-skills/knowledge-graph/TOOLS.json +0 -66
package/src/config/bundled-skills/knowledge-graph/tools/graph-query.ts +0 -211
package/src/daemon/session-conflict-gate.ts +0 -167
package/src/daemon/session-dynamic-profile.ts +0 -77
package/src/memory/clarification-resolver.ts +0 -417
package/src/memory/conflict-intent.ts +0 -205
package/src/memory/conflict-policy.ts +0 -127
package/src/memory/conflict-store.ts +0 -410
package/src/memory/contradiction-checker.ts +0 -508
package/src/memory/entity-extractor.ts +0 -535
package/src/memory/format-recall.ts +0 -47
package/src/memory/fts-reconciler.ts +0 -165
package/src/memory/job-handlers/conflict.ts +0 -200
package/src/memory/profile-compiler.ts +0 -195
package/src/memory/recall-cache.ts +0 -117
package/src/memory/search/entity.ts +0 -535
package/src/memory/search/query-expansion.test.ts +0 -70
package/src/memory/search/query-expansion.ts +0 -118
package/src/runtime/routes/mcp-routes.ts +0 -20

package/src/memory/search/ranking.ts CHANGED Viewed

@@ -1,325 +1,3 @@
-import { inArray, sql } from "drizzle-orm";
-import type {
-  AssistantConfig,
-  MemoryRerankingConfig,
-} from "../../config/types.js";
-import { estimateTextTokens } from "../../context/token-estimator.js";
-import {
-  extractText,
-  getConfiguredProvider,
-  userMessage,
-} from "../../providers/provider-send-message.js";
-import { getLogger } from "../../util/logger.js";
-import { getDb } from "../db.js";
-import { memoryItems } from "../schema.js";
-import { buildInjectedText } from "./formatting.js";
-import type { Candidate, CandidateSource, ItemMetadata } from "./types.js";
-const log = getLogger("memory-retriever");
-/**
- * Trust weight by verification state. Higher = more trusted.
- * Bounded: lowest weight is 0.7, never zero -- low-trust items are
- * down-ranked but not suppressed.
- */
-const TRUST_WEIGHTS: Record<string, number> = {
-  user_confirmed: 1.0,
-  user_reported: 0.9,
-  assistant_inferred: 0.7,
-};
-const DEFAULT_TRUST_WEIGHT = 0.85;
-export const SOURCE_WEIGHTS: Record<CandidateSource, number> = {
-  lexical: 1.0,
-  semantic: 1.0,
-  recency: 1.0,
-  entity_direct: 1.0,
-  item_direct: 0.95,
-  entity_relation: 1.0,
-};
-const MS_PER_DAY = 86_400_000;
-/**
- * Reciprocal Rank Fusion (RRF) -- merge candidates from independent ranking
- * lists without assuming comparable score scales.
- *
- * Each candidate's RRF contribution from a list is `1 / (k + rank)` where
- * rank is 1-based position in that list sorted by its native score.
- * The final score is further modulated by importance so that high-importance
- * memories surface more readily.
- *
- * For item-type candidates we also apply retrieval reinforcement: access_count
- * from the DB boosts effective importance via `min(1, importance + 0.03 * accessCount)`.
- */
-export function mergeCandidates(
-  lexical: Candidate[],
-  semantic: Candidate[],
-  recency: Candidate[],
-  entity: Candidate[] = [],
-  freshnessConfig?: {
-    enabled: boolean;
-    maxAgeDays: Record<string, number>;
-    staleDecay: number;
-    reinforcementShieldDays: number;
-  },
-  relationScoreMultiplier?: number,
-  candidateDepthMap?: Map<string, number>,
-): Candidate[] {
-  // Build effective weight map that reflects the actual scoring weight for
-  // each source.  For entity_relation the static SOURCE_WEIGHTS entry is 1.0
-  // (a neutral placeholder) but the real multiplier comes from the config
-  // (relationScoreMultiplier).  Using the effective weight in the dedup
-  // upgrade comparison ensures item_direct (0.95) correctly outranks
-  // entity_relation (e.g. 0.7) when both sources return the same candidate.
-  const effectiveWeights: Record<string, number> = { ...SOURCE_WEIGHTS };
-  if (relationScoreMultiplier != null) {
-    effectiveWeights["entity_relation"] = relationScoreMultiplier;
-  }
-  // Build merged candidate map (dedup by key, keep best metadata)
-  const merged = new Map<string, Candidate>();
-  for (const candidate of [...lexical, ...semantic, ...recency, ...entity]) {
-    const existing = merged.get(candidate.key);
-    if (!existing) {
-      merged.set(candidate.key, { ...candidate });
-      continue;
-    }
-    existing.lexical = Math.max(existing.lexical, candidate.lexical);
-    existing.semantic = Math.max(existing.semantic, candidate.semantic);
-    existing.recency = Math.max(existing.recency, candidate.recency);
-    existing.confidence = Math.max(existing.confidence, candidate.confidence);
-    existing.importance = Math.max(existing.importance, candidate.importance);
-    if (candidate.text.length > existing.text.length) {
-      existing.text = candidate.text;
-    }
-    // Upgrade source to whichever has the higher effective weight so scoring
-    // and caps reflect the strongest retrieval signal for this candidate.
-    const existingWeight = effectiveWeights[existing.source] ?? 1.0;
-    const candidateWeight = effectiveWeights[candidate.source] ?? 1.0;
-    if (candidateWeight > existingWeight) {
-      existing.source = candidate.source;
-    }
-  }
-  // Build 1-based rank maps from each list (sorted by native score desc)
-  const lexicalRanks = buildRankMap(lexical, (c) => c.lexical);
-  const semanticRanks = buildRankMap(semantic, (c) => c.semantic);
-  const recencyRanks = buildRankMap(recency, (c) => c.recency);
-  const entityRanks = buildRankMap(entity, (c) => c.confidence);
-  // Look up access_count and verification_state for item-type candidates
-  const itemIds = [...merged.values()]
-    .filter((c) => c.type === "item")
-    .map((c) => c.id);
-  const itemMetadata = lookupItemMetadata(itemIds);
-  const rows = [...merged.values()];
-  for (const row of rows) {
-    const ranks: number[] = [];
-    if (lexicalRanks.has(row.key)) ranks.push(lexicalRanks.get(row.key)!);
-    if (semanticRanks.has(row.key)) ranks.push(semanticRanks.get(row.key)!);
-    if (recencyRanks.has(row.key)) ranks.push(recencyRanks.get(row.key)!);
-    if (entityRanks.has(row.key)) ranks.push(entityRanks.get(row.key)!);
-    const rrfScore = rrf(ranks);
-    // Retrieval reinforcement: boost importance by accessCount
-    const meta = itemMetadata.get(row.id);
-    const accessCount = meta?.accessCount ?? 0;
-    const effectiveImportance = Math.min(
-      1,
-      row.importance + 0.03 * accessCount,
-    );
-    // Trust-aware ranking: only apply to item candidates (segments/summaries have no metadata)
-    const trustWeight =
-      row.type === "item" && meta
-        ? (TRUST_WEIGHTS[meta.verificationState] ?? DEFAULT_TRUST_WEIGHT)
-        : 1.0;
-    // Freshness decay: down-rank stale items unless recently reinforced
-    const lastUsedAt = meta?.lastUsedAt ?? null;
-    const freshnessWeight = computeFreshnessWeight(
-      row,
-      accessCount,
-      lastUsedAt,
-      freshnessConfig,
-    );
-    let sourceWeight = effectiveWeights[row.source] ?? 1.0;
-    if (
-      row.source === "entity_relation" &&
-      candidateDepthMap &&
-      relationScoreMultiplier != null
-    ) {
-      const depth = candidateDepthMap.get(row.key) ?? 1;
-      sourceWeight = Math.pow(relationScoreMultiplier, depth);
-    }
-    row.finalScore =
-      rrfScore *
-      (0.5 + 0.5 * effectiveImportance) *
-      trustWeight *
-      freshnessWeight *
-      sourceWeight;
-  }
-  rows.sort((a, b) => {
-    const scoreDelta = b.finalScore - a.finalScore;
-    if (scoreDelta !== 0) return scoreDelta;
-    const createdAtDelta = b.createdAt - a.createdAt;
-    if (createdAtDelta !== 0) return createdAtDelta;
-    return a.key.localeCompare(b.key);
-  });
-  return rows;
-}
-export function applySourceCaps(
-  candidates: Candidate[],
-  config: AssistantConfig,
-): Candidate[] {
-  if (candidates.length === 0) return candidates;
-  const sourceCaps = buildSourceCaps(config);
-  const counts: Partial<Record<CandidateSource, number>> = {};
-  const capped: Candidate[] = [];
-  for (const candidate of candidates) {
-    const cap = sourceCaps[candidate.source];
-    const current = counts[candidate.source] ?? 0;
-    if (current >= cap) continue;
-    counts[candidate.source] = current + 1;
-    capped.push(candidate);
-  }
-  return capped;
-}
-function buildSourceCaps(
-  config: AssistantConfig,
-): Record<CandidateSource, number> {
-  const lexicalTopK = Math.max(1, config.memory.retrieval.lexicalTopK);
-  const semanticTopK = Math.max(1, config.memory.retrieval.semanticTopK);
-  const relationLimit = Math.max(
-    3,
-    Math.floor(
-      Math.min(
-        config.memory.entity.relationRetrieval.maxNeighborEntities,
-        config.memory.entity.relationRetrieval.maxEdges,
-        semanticTopK,
-      ) * 0.4,
-    ),
-  );
-  return {
-    lexical: Math.max(12, lexicalTopK),
-    semantic: Math.max(8, semanticTopK),
-    recency: Math.max(6, Math.floor(semanticTopK / 2)),
-    entity_direct: Math.max(6, Math.floor(semanticTopK / 2)),
-    item_direct: Math.max(8, Math.floor(lexicalTopK / 2)),
-    entity_relation: relationLimit,
-  };
-}
-/** Reciprocal Rank Fusion score: sum of 1/(k+rank) across all lists. */
-function rrf(ranks: number[], k = 60): number {
-  return ranks.reduce((sum, rank) => sum + 1 / (k + rank), 0);
-}
-/**
- * Build a map from candidate key to 1-based rank within a list,
- * sorted descending by the given score accessor.
- */
-function buildRankMap(
-  candidates: Candidate[],
-  scoreAccessor: (c: Candidate) => number,
-): Map<string, number> {
-  const sorted = [...candidates].sort(
-    (a, b) => scoreAccessor(b) - scoreAccessor(a),
-  );
-  const rankMap = new Map<string, number>();
-  for (let i = 0; i < sorted.length; i++) {
-    rankMap.set(sorted[i].key, i + 1);
-  }
-  return rankMap;
-}
-/**
- * Look up access_count and verification_state from memory_items for a batch of item IDs.
- */
-function lookupItemMetadata(itemIds: string[]): Map<string, ItemMetadata> {
-  const metadata = new Map<string, ItemMetadata>();
-  if (itemIds.length === 0) return metadata;
-  try {
-    const db = getDb();
-    const rows = db
-      .select({
-        id: memoryItems.id,
-        accessCount: memoryItems.accessCount,
-        lastUsedAt: memoryItems.lastUsedAt,
-        verificationState: memoryItems.verificationState,
-      })
-      .from(memoryItems)
-      .where(inArray(memoryItems.id, itemIds))
-      .all();
-    for (const row of rows) {
-      metadata.set(row.id, {
-        accessCount: row.accessCount,
-        lastUsedAt: row.lastUsedAt,
-        verificationState: row.verificationState,
-      });
-    }
-  } catch (err) {
-    log.warn({ err }, "Failed to look up item metadata for retrieval ranking");
-  }
-  return metadata;
-}
-/**
- * Compute a freshness weight for a candidate based on its kind and age.
- * Returns 1.0 for fresh items and `staleDecay` for items past their window.
- * Items with recent reinforcement (accessed via lastUsedAt within the shield
- * window) are shielded from decay.
- */
-export function computeFreshnessWeight(
-  candidate: { type: string; kind: string; createdAt: number },
-  accessCount: number,
-  lastUsedAt: number | null,
-  config?: {
-    enabled: boolean;
-    maxAgeDays: Record<string, number>;
-    staleDecay: number;
-    reinforcementShieldDays: number;
-  },
-): number {
-  if (!config?.enabled) return 1.0;
-  // Only apply freshness to item-type candidates
-  if (candidate.type !== "item") return 1.0;
-  const maxAgeDays = config.maxAgeDays[candidate.kind] ?? 0;
-  // maxAgeDays of 0 means no expiry for this kind
-  if (maxAgeDays <= 0) return 1.0;
-  const now = Date.now();
-  const ageMs = now - candidate.createdAt;
-  const ageDays = ageMs / MS_PER_DAY;
-  if (ageDays <= maxAgeDays) return 1.0;
-  // Check reinforcement shield: items retrieved within the shield window are protected
-  if (
-    accessCount > 0 &&
-    lastUsedAt != null &&
-    config.reinforcementShieldDays > 0
-  ) {
-    const shieldCutoff = now - config.reinforcementShieldDays * MS_PER_DAY;
-    if (lastUsedAt >= shieldCutoff) return 1.0;
-  }
-  return config.staleDecay;
-}
 /**
  * Logarithmic recency decay (ACT-R inspired).
  *
@@ -335,136 +13,3 @@ export function computeRecencyScore(createdAt: number): number {
   const ageDays = ageMs / (24 * 60 * 60 * 1000);
   return 1 / (1 + Math.log2(1 + ageDays));
 }
-/**
- * LLM re-ranking: send candidate memories to Haiku for relevance scoring.
- * Returns candidates re-sorted by LLM-assigned relevance score.
- */
-export async function rerankWithLLM(
-  query: string,
-  candidates: Candidate[],
-  rerankingConfig: MemoryRerankingConfig,
-): Promise<Candidate[]> {
-  const provider = getConfiguredProvider();
-  if (!provider) {
-    log.debug("Configured provider unavailable for LLM re-ranking, skipping");
-    return candidates;
-  }
-  const candidateList = candidates.map((c, i) => ({
-    index: i,
-    id: c.key,
-    text: truncate(c.text, 200),
-  }));
-  const response = await provider.sendMessage(
-    [
-      userMessage(
-        `Query: ${truncate(query, 200)}\n\nCandidates:\n${candidateList
-          .map((c) => `[${c.index}] ${c.text}`)
-          .join("\n")}`,
-      ),
-    ],
-    undefined,
-    'You are a relevance scoring assistant. Given a query and a list of memory candidates, rate each candidate\'s relevance to the query on a scale of 0-10. Return ONLY a JSON array of objects with "index" (the candidate index) and "score" (0-10 integer). No explanation.',
-    {
-      config: {
-        modelIntent: rerankingConfig.modelIntent,
-        max_tokens: 1024,
-      },
-    },
-  );
-  // Extract text from the response
-  const responseText = extractText(response);
-  if (!responseText) {
-    log.warn("LLM re-ranking returned no text block, skipping");
-    return candidates;
-  }
-  // Parse the JSON array from the response
-  const jsonMatch = responseText.match(/\[[\s\S]*\]/);
-  if (!jsonMatch) {
-    log.warn("LLM re-ranking response did not contain JSON array, skipping");
-    return candidates;
-  }
-  let scores: Array<{ index: number; score: number }>;
-  try {
-    scores = JSON.parse(jsonMatch[0]) as Array<{
-      index: number;
-      score: number;
-    }>;
-  } catch {
-    log.warn("Failed to parse LLM re-ranking JSON response, skipping");
-    return candidates;
-  }
-  // Build a score map from LLM results
-  const scoreMap = new Map<number, number>();
-  for (const entry of scores) {
-    if (typeof entry.index === "number" && typeof entry.score === "number") {
-      scoreMap.set(entry.index, Math.max(0, Math.min(10, entry.score)));
-    }
-  }
-  // Re-sort candidates by LLM score (desc); unscored candidates keep original order after scored ones
-  const reranked = candidates.map((c, i) => ({
-    candidate: c,
-    llmScore: scoreMap.has(i) ? scoreMap.get(i)! : null,
-    originalIndex: i,
-  }));
-  reranked.sort((a, b) => {
-    // Scored items come before unscored items
-    if (a.llmScore != null && b.llmScore == null) return -1;
-    if (a.llmScore == null && b.llmScore != null) return 1;
-    // Both scored: sort by score descending
-    if (a.llmScore != null && b.llmScore != null) {
-      const scoreDelta = b.llmScore - a.llmScore;
-      if (scoreDelta !== 0) return scoreDelta;
-    }
-    // Both unscored or tie: preserve original RRF order
-    return a.originalIndex - b.originalIndex;
-  });
-  return reranked.map((r) => r.candidate);
-}
-export function trimToTokenBudget(
-  candidates: Candidate[],
-  maxTokens: number,
-  format: string = "markdown",
-): Candidate[] {
-  if (maxTokens <= 0) return [];
-  const selected: Candidate[] = [];
-  for (const candidate of candidates) {
-    const tentativeText = buildInjectedText([...selected, candidate], format);
-    const cost = estimateTextTokens(tentativeText);
-    if (cost > maxTokens) continue;
-    selected.push(candidate);
-    if (cost >= maxTokens) break;
-  }
-  return selected;
-}
-export function markItemUsage(candidates: Candidate[]): void {
-  const itemIds = candidates
-    .filter((candidate) => candidate.type === "item")
-    .map((candidate) => candidate.id);
-  if (itemIds.length === 0) return;
-  const db = getDb();
-  const now = Date.now();
-  db.update(memoryItems)
-    .set({
-      lastUsedAt: now,
-      accessCount: sql`${memoryItems.accessCount} + 1`,
-    })
-    .where(inArray(memoryItems.id, itemIds))
-    .run();
-}
-function truncate(text: string, max: number): string {
-  if (text.length <= max) return text;
-  return `${text.slice(0, max - 3)}...`;
-}

package/src/memory/search/semantic.ts CHANGED Viewed

@@ -7,7 +7,10 @@ import {
   _resetQdrantBreaker,
   withQdrantBreaker,
 } from "../qdrant-circuit-breaker.js";
-import type { QdrantSearchResult } from "../qdrant-client.js";
+import type {
+  QdrantSearchResult,
+  QdrantSparseVector,
+} from "../qdrant-client.js";
 import { getQdrantClient } from "../qdrant-client.js";
 import {
   conversations,
@@ -31,6 +34,7 @@ export async function semanticSearch(
   limit: number,
   excludedMessageIds: string[] = [],
   scopeIds?: string[],
+  sparseVector?: QdrantSparseVector,
 ): Promise<Candidate[]> {
   if (limit <= 0) return [];
@@ -40,14 +44,33 @@ export async function semanticSearch(
   // Use 3x when exclusions are active to ensure enough results survive filtering
   const overfetchMultiplier = excludedMessageIds.length > 0 ? 3 : 2;
   const fetchLimit = limit * overfetchMultiplier;
-  const results: QdrantSearchResult[] = await withQdrantBreaker(() =>
-    qdrant.searchWithFilter(
-      queryVector,
-      fetchLimit,
-      ["item", "summary", "segment", "media"],
-      excludedMessageIds,
-    ),
-  );
+  // When a sparse vector is available, use hybrid search (dense + sparse RRF fusion)
+  // for better recall; otherwise fall back to dense-only search.
+  let results: QdrantSearchResult[];
+  let isHybrid = false;
+  if (sparseVector && sparseVector.indices.length > 0) {
+    isHybrid = true;
+    const filter = buildHybridFilter(excludedMessageIds, scopeIds);
+    results = await withQdrantBreaker(() =>
+      qdrant.hybridSearch({
+        denseVector: queryVector,
+        sparseVector,
+        filter,
+        limit: fetchLimit,
+        prefetchLimit: fetchLimit,
+      }),
+    );
+  } else {
+    results = await withQdrantBreaker(() =>
+      qdrant.searchWithFilter(
+        queryVector,
+        fetchLimit,
+        ["item", "summary", "segment", "media"],
+        excludedMessageIds,
+      ),
+    );
+  }
   const db = getDb();
@@ -137,7 +160,8 @@ export async function semanticSearch(
   const candidates: Candidate[] = [];
   for (const result of results) {
     const { payload, score } = result;
-    const semantic = mapCosineToUnit(score);
+    // Store raw score; hybrid RRF normalization happens after filtering
+    const semantic = isHybrid ? score : mapCosineToUnit(score);
     const createdAt = payload.created_at ?? Date.now();
     if (payload.target_type === "item") {
@@ -160,7 +184,6 @@ export async function semanticSearch(
         confidence: item.confidence,
         importance: item.importance ?? 0.5,
         createdAt: item.lastSeenAt,
-        lexical: 0,
         semantic,
         recency: computeRecencyScore(item.lastSeenAt),
         finalScore: 0,
@@ -181,7 +204,6 @@ export async function semanticSearch(
         confidence: 0.6,
         importance: 0.6,
         createdAt: payload.last_seen_at ?? createdAt,
-        lexical: 0,
         semantic,
         recency: computeRecencyScore(payload.last_seen_at ?? createdAt),
         finalScore: 0,
@@ -214,7 +236,6 @@ export async function semanticSearch(
         confidence: 0.7,
         importance: 0.6,
         createdAt,
-        lexical: 0,
         semantic,
         recency: computeRecencyScore(createdAt),
         finalScore: 0,
@@ -234,7 +255,6 @@ export async function semanticSearch(
         confidence: 0.55,
         importance: 0.5,
         createdAt,
-        lexical: 0,
         semantic,
         recency: computeRecencyScore(createdAt),
         finalScore: 0,
@@ -242,9 +262,75 @@ export async function semanticSearch(
     }
     if (candidates.length >= limit) break;
   }
+  // For hybrid search (RRF fusion), normalize semantic scores relative to
+  // the surviving candidates' maximum — not the raw Qdrant batch. Filtered-out
+  // high-scoring hits must not anchor normalization and deflate survivors.
+  if (isHybrid && candidates.length > 0) {
+    const maxScore = Math.max(...candidates.map((c) => c.semantic));
+    if (maxScore > 0) {
+      for (const c of candidates) {
+        c.semantic = c.semantic / maxScore;
+      }
+    }
+  }
   return candidates;
 }
+/**
+ * Build a Qdrant filter for hybrid search. Mirrors the logic in
+ * `searchWithFilter` but as a standalone object for the query API.
+ *
+ * Scope filtering: items and media store `memory_scope_id` on the Qdrant
+ * point payload, so we can filter at the Qdrant level. Segments and
+ * summaries rely on post-query DB filtering (same as dense-only search).
+ */
+function buildHybridFilter(
+  excludeMessageIds: string[],
+  _scopeIds?: string[],
+): Record<string, unknown> {
+  const mustConditions: Array<Record<string, unknown>> = [
+    {
+      key: "target_type",
+      match: { any: ["item", "summary", "segment", "media"] },
+    },
+  ];
+  if (excludeMessageIds.length > 0) {
+    // Only require status=active for items; segments and summaries don't have a status field
+    mustConditions.push({
+      should: [
+        {
+          must: [
+            { key: "target_type", match: { value: "item" } },
+            { key: "status", match: { value: "active" } },
+          ],
+        },
+        {
+          key: "target_type",
+          match: { any: ["segment", "summary", "media"] },
+        },
+      ],
+    });
+  }
+  const mustNotConditions: Array<Record<string, unknown>> = [
+    { key: "_meta", match: { value: true } },
+  ];
+  if (excludeMessageIds.length > 0) {
+    mustNotConditions.push({
+      key: "message_id",
+      match: { any: excludeMessageIds },
+    });
+  }
+  return {
+    must: mustConditions,
+    must_not: mustNotConditions,
+  };
+}
 export function mapCosineToUnit(value: number): number {
   return Math.max(0, Math.min(1, (value + 1) / 2));
 }

package/src/memory/search/staleness.ts ADDED Viewed

@@ -0,0 +1,47 @@
+import type { TieredCandidate } from "./tier-classifier.js";
+import type { StalenessLevel } from "./types.js";
+const BASE_LIFETIME_MS: Record<string, number> = {
+  identity: 180 * 86_400_000, // 6 months
+  preference: 90 * 86_400_000, // 3 months
+  constraint: 30 * 86_400_000, // 1 month
+  project: 14 * 86_400_000, // 2 weeks
+  decision: 14 * 86_400_000, // 2 weeks
+  event: 3 * 86_400_000, // 3 days
+};
+const DEFAULT_LIFETIME_MS = 30 * 86_400_000;
+export function computeStaleness(
+  item: {
+    kind: string;
+    firstSeenAt: number;
+    sourceConversationCount: number;
+  },
+  now: number,
+): { level: StalenessLevel; ratio: number } {
+  const baseLifetime = BASE_LIFETIME_MS[item.kind] ?? DEFAULT_LIFETIME_MS;
+  const reinforcement = Math.max(1, 1 + 0.3 * (item.sourceConversationCount - 1));
+  const effectiveLifetime = baseLifetime * reinforcement;
+  const age = now - item.firstSeenAt;
+  const ratio = age / effectiveLifetime;
+  if (ratio < 0.5) return { level: "fresh", ratio };
+  if (ratio <= 1) return { level: "aging", ratio };
+  if (ratio <= 2) return { level: "stale", ratio };
+  return { level: "very_stale", ratio };
+}
+/**
+ * Demote very_stale tier-1 candidates to tier 2.
+ */
+export function applyStaleDemotion(
+  candidates: TieredCandidate[],
+): TieredCandidate[] {
+  return candidates.map((c) => {
+    if (c.tier === 1 && c.staleness === "very_stale") {
+      return { ...c, tier: 2 as const };
+    }
+    return c;
+  });
+}

package/src/memory/search/tier-classifier.ts ADDED Viewed

@@ -0,0 +1,21 @@
+import type { Candidate } from "./types.js";
+export type Tier = 1 | 2;
+export interface TieredCandidate extends Candidate {
+  tier: Tier;
+  /** Human-readable label for the source conversation/summary (e.g. conversation title). */
+  sourceLabel?: string;
+}
+export function classifyTier(score: number): Tier | null {
+  if (score > 0.8) return 1;
+  if (score > 0.6) return 2;
+  return null;
+}
+export function classifyTiers(candidates: Candidate[]): TieredCandidate[] {
+  return candidates
+    .map((c) => ({ ...c, tier: classifyTier(c.finalScore) }))
+    .filter((c): c is TieredCandidate => c.tier != null);
+}