npm - causantic - Versions diffs - 0.10.0 → 0.10.2 - Mend

causantic 0.10.0 → 0.10.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (160) hide show

package/README.md +2 -7
package/config.schema.json +66 -0
package/dist/cli/commands/init/ingest.js +2 -2
package/dist/cli/commands/init/ingest.js.map +1 -1
package/dist/cli/skill-templates.js +2 -2
package/dist/clusters/cluster-manager.d.ts.map +1 -1
package/dist/clusters/cluster-manager.js.map +1 -1
package/dist/config/bootstrap.d.ts +20 -0
package/dist/config/bootstrap.d.ts.map +1 -0
package/dist/config/bootstrap.js +24 -0
package/dist/config/bootstrap.js.map +1 -0
package/dist/config/index.d.ts +1 -0
package/dist/config/index.d.ts.map +1 -1
package/dist/config/index.js +1 -0
package/dist/config/index.js.map +1 -1
package/dist/config/loader.d.ts +16 -1
package/dist/config/loader.d.ts.map +1 -1
package/dist/config/loader.js +194 -176
package/dist/config/loader.js.map +1 -1
package/dist/config/memory-config.d.ts +12 -0
package/dist/config/memory-config.d.ts.map +1 -1
package/dist/config/memory-config.js +64 -6
package/dist/config/memory-config.js.map +1 -1
package/dist/dashboard/server.d.ts.map +1 -1
package/dist/dashboard/server.js +3 -1
package/dist/dashboard/server.js.map +1 -1
package/dist/eval/experiments/embedding-model-comparison/run-experiment.js.map +1 -1
package/dist/eval/experiments/index-differentiation/alignment-analysis.d.ts.map +1 -1
package/dist/eval/experiments/index-differentiation/alignment-analysis.js +3 -9
package/dist/eval/experiments/index-differentiation/alignment-analysis.js.map +1 -1
package/dist/eval/experiments/index-differentiation/discrimination-test.d.ts.map +1 -1
package/dist/eval/experiments/index-differentiation/discrimination-test.js.map +1 -1
package/dist/eval/experiments/index-differentiation/refinement-test.d.ts.map +1 -1
package/dist/eval/experiments/index-differentiation/refinement-test.js +1 -3
package/dist/eval/experiments/index-differentiation/refinement-test.js.map +1 -1
package/dist/eval/experiments/index-differentiation/run-experiment.js +5 -7
package/dist/eval/experiments/index-differentiation/run-experiment.js.map +1 -1
package/dist/eval/experiments/index-differentiation/similarity-analysis.d.ts.map +1 -1
package/dist/eval/experiments/index-differentiation/similarity-analysis.js.map +1 -1
package/dist/eval/experiments/index-vs-chunk/jeopardy-experiment.js +1 -3
package/dist/eval/experiments/index-vs-chunk/jeopardy-experiment.js.map +1 -1
package/dist/eval/experiments/index-vs-chunk/jeopardy-generator.js.map +1 -1
package/dist/eval/experiments/index-vs-chunk/query-generator.js.map +1 -1
package/dist/eval/experiments/index-vs-chunk/run-experiment.js +6 -16
package/dist/eval/experiments/index-vs-chunk/run-experiment.js.map +1 -1
package/dist/eval/experiments/pipeline-dropout/run-experiment.js +12 -4
package/dist/eval/experiments/pipeline-dropout/run-experiment.js.map +1 -1
package/dist/eval/experiments/rescorer-ceiling/analyze-misses.js.map +1 -1
package/dist/eval/experiments/rescorer-ceiling/benchmark-rescorers.js +26 -12
package/dist/eval/experiments/rescorer-ceiling/benchmark-rescorers.js.map +1 -1
package/dist/eval/experiments/rescorer-ceiling/run-experiment.js +1 -1
package/dist/eval/experiments/rescorer-ceiling/run-experiment.js.map +1 -1
package/dist/hooks/hook-utils.d.ts +1 -1
package/dist/hooks/hook-utils.d.ts.map +1 -1
package/dist/hooks/hook-utils.js +4 -2
package/dist/hooks/hook-utils.js.map +1 -1
package/dist/hooks/session-start.d.ts.map +1 -1
package/dist/hooks/session-start.js +4 -1
package/dist/hooks/session-start.js.map +1 -1
package/dist/index-entries/index-generator.d.ts.map +1 -1
package/dist/index-entries/index-generator.js +1 -3
package/dist/index-entries/index-generator.js.map +1 -1
package/dist/index-entries/index-refresher.d.ts.map +1 -1
package/dist/index-entries/index-refresher.js.map +1 -1
package/dist/index-entries/index.d.ts +1 -1
package/dist/index-entries/index.d.ts.map +1 -1
package/dist/index-entries/index.js +1 -1
package/dist/index-entries/index.js.map +1 -1
package/dist/ingest/brief-debrief-detector.d.ts.map +1 -1
package/dist/ingest/brief-debrief-detector.js +6 -5
package/dist/ingest/brief-debrief-detector.js.map +1 -1
package/dist/ingest/ingest-session.d.ts.map +1 -1
package/dist/ingest/ingest-session.js +109 -37
package/dist/ingest/ingest-session.js.map +1 -1
package/dist/ingest/session-state.d.ts.map +1 -1
package/dist/ingest/session-state.js +6 -18
package/dist/ingest/session-state.js.map +1 -1
package/dist/mcp/server.d.ts +1 -1
package/dist/mcp/server.d.ts.map +1 -1
package/dist/mcp/server.js +15 -5
package/dist/mcp/server.js.map +1 -1
package/dist/mcp/services.d.ts.map +1 -1
package/dist/mcp/services.js +9 -0
package/dist/mcp/services.js.map +1 -1
package/dist/mcp/tools.d.ts.map +1 -1
package/dist/mcp/tools.js +36 -47
package/dist/mcp/tools.js.map +1 -1
package/dist/models/embedder.d.ts.map +1 -1
package/dist/models/embedder.js +1 -0
package/dist/models/embedder.js.map +1 -1
package/dist/repomap/parser.d.ts.map +1 -1
package/dist/repomap/parser.js +71 -22
package/dist/repomap/parser.js.map +1 -1
package/dist/repomap/regex-parser.d.ts.map +1 -1
package/dist/repomap/regex-parser.js +30 -6
package/dist/repomap/regex-parser.js.map +1 -1
package/dist/repomap/renderer.d.ts.map +1 -1
package/dist/repomap/renderer.js.map +1 -1
package/dist/repomap/scanner.d.ts.map +1 -1
package/dist/repomap/scanner.js +30 -11
package/dist/repomap/scanner.js.map +1 -1
package/dist/retrieval/chain-walker.d.ts.map +1 -1
package/dist/retrieval/chain-walker.js +6 -2
package/dist/retrieval/chain-walker.js.map +1 -1
package/dist/retrieval/context-assembler.d.ts +1 -1
package/dist/retrieval/context-assembler.d.ts.map +1 -1
package/dist/retrieval/rrf.d.ts +1 -1
package/dist/retrieval/rrf.d.ts.map +1 -1
package/dist/retrieval/rrf.js +1 -1
package/dist/retrieval/rrf.js.map +1 -1
package/dist/retrieval/search-assembler.d.ts +1 -1
package/dist/retrieval/search-assembler.d.ts.map +1 -1
package/dist/retrieval/search-assembler.js +324 -227
package/dist/retrieval/search-assembler.js.map +1 -1
package/dist/retrieval/session-reconstructor.d.ts.map +1 -1
package/dist/retrieval/session-reconstructor.js +7 -5
package/dist/retrieval/session-reconstructor.js.map +1 -1
package/dist/storage/chunk-store.d.ts.map +1 -1
package/dist/storage/chunk-store.js +2 -0
package/dist/storage/chunk-store.js.map +1 -1
package/dist/storage/cluster-store.d.ts.map +1 -1
package/dist/storage/cluster-store.js +3 -11
package/dist/storage/cluster-store.js.map +1 -1
package/dist/storage/db.d.ts +7 -0
package/dist/storage/db.d.ts.map +1 -1
package/dist/storage/db.js +25 -4
package/dist/storage/db.js.map +1 -1
package/dist/storage/entity-store.d.ts +48 -0
package/dist/storage/entity-store.d.ts.map +1 -0
package/dist/storage/entity-store.js +111 -0
package/dist/storage/entity-store.js.map +1 -0
package/dist/storage/index-entry-store.d.ts.map +1 -1
package/dist/storage/index-entry-store.js +39 -40
package/dist/storage/index-entry-store.js.map +1 -1
package/dist/storage/keyword-store.d.ts +5 -0
package/dist/storage/keyword-store.d.ts.map +1 -1
package/dist/storage/keyword-store.js +1 -1
package/dist/storage/keyword-store.js.map +1 -1
package/dist/storage/migrations.d.ts.map +1 -1
package/dist/storage/migrations.js +45 -0
package/dist/storage/migrations.js.map +1 -1
package/dist/storage/schema.sql +38 -2
package/dist/storage/session-state-store.d.ts.map +1 -1
package/dist/storage/session-state-store.js +46 -8
package/dist/storage/session-state-store.js.map +1 -1
package/dist/storage/types.d.ts +4 -2
package/dist/storage/types.d.ts.map +1 -1
package/dist/storage/vector-store-cleanup.d.ts +47 -0
package/dist/storage/vector-store-cleanup.d.ts.map +1 -0
package/dist/storage/vector-store-cleanup.js +101 -0
package/dist/storage/vector-store-cleanup.js.map +1 -0
package/dist/storage/vector-store.d.ts +13 -1
package/dist/storage/vector-store.d.ts.map +1 -1
package/dist/storage/vector-store.js +56 -111
package/dist/storage/vector-store.js.map +1 -1
package/dist/utils/entity-extractor.d.ts +23 -0
package/dist/utils/entity-extractor.d.ts.map +1 -0
package/dist/utils/entity-extractor.js +233 -0
package/dist/utils/entity-extractor.js.map +1 -0
package/package.json +3 -2

package/dist/retrieval/search-assembler.js CHANGED Viewed

@@ -17,9 +17,13 @@ import { KeywordStore } from '../storage/keyword-store.js';
 import { fuseRRF } from './rrf.js';
 import { expandViaClusters } from './cluster-expander.js';
 import { reorderWithMMR } from './mmr.js';
+import { extractEntities } from '../utils/entity-extractor.js';
+import { findEntitiesByAlias, getChunkIdsForEntity } from '../storage/entity-store.js';
 import { createLogger } from '../utils/logger.js';
 import { formatSearchChunk } from './formatting.js';
 const log = createLogger('search-assembler');
+/** RRF weight for entity-boosted results. */
+const ENTITY_RRF_BOOST = 1.5;
 /**
  * Shared embedder instance.
  */
@@ -50,243 +54,258 @@ function getKeywordStore() {
     }
     return sharedKeywordStore;
 }
+// ── Extracted pipeline stages ────────────────────────────────────────────────
 /**
- * Run the search pipeline.
+ * Filter items by agent when agent filtering is active but project filtering is not.
  *
- * Keyword-primary mode: keyword → [optional vector enrichment] → recency → MMR → budget
- * Hybrid mode:          embed → [vector, keyword] → RRF → cluster expand → recency → MMR → budget
+ * When projectFilter is set, agent filtering is handled by the storage layer.
+ * This function handles the post-filter case where no project scope was provided.
  */
-export async function searchContext(request) {
-    const startTime = Date.now();
-    const externalConfig = loadConfig();
-    const config = toRuntimeConfig(externalConfig);
-    const { query, currentSessionId, projectFilter, maxTokens = config.mcpMaxResponseTokens, vectorSearchLimit = 20, skipClusters = false, agentFilter, } = request;
-    const { hybridSearch, clusterExpansion, mmrReranking, embeddingModel } = config;
-    const retrievalMode = config.retrievalPrimary;
-    let fusedResults;
-    let queryEmbedding = [];
-    let useIndexSearch = false;
-    if (retrievalMode === 'keyword') {
-        // ── Keyword-primary search path ──────────────────────────────────────
-        // No embedding needed unless vector enrichment is enabled.
-        let keywordResults = [];
-        try {
-            const keywordStore = getKeywordStore();
-            keywordResults = projectFilter
-                ? keywordStore.searchByProject(query, projectFilter, hybridSearch.keywordSearchLimit, agentFilter)
-                : keywordStore.search(query, hybridSearch.keywordSearchLimit);
-        }
-        catch (error) {
-            log.warn('Keyword search failed', { error: error.message });
-        }
-        // Post-filter by agent when no project filter was used
-        if (agentFilter && !projectFilter) {
-            keywordResults = keywordResults.filter((r) => {
-                const chunk = getChunkById(r.id);
-                return chunk?.agentId === agentFilter;
-            });
-        }
-        fusedResults = keywordResults.map((r) => ({
-            chunkId: r.id,
-            score: r.score,
-            source: 'keyword',
-        }));
-        // Optional vector enrichment: merge vector results via RRF
-        if (config.vectorEnrichment) {
-            try {
-                vectorStore.setModelId(embeddingModel);
-                const embedder = await getEmbedder(embeddingModel);
-                const queryResult = await embedder.embed(query, true);
-                queryEmbedding = queryResult.embedding;
-                let vectorResults = await (projectFilter
-                    ? vectorStore.searchByProject(queryResult.embedding, projectFilter, vectorSearchLimit, agentFilter)
-                    : vectorStore.search(queryResult.embedding, vectorSearchLimit));
-                if (agentFilter && !projectFilter) {
-                    vectorResults = vectorResults.filter((s) => {
-                        const chunk = getChunkById(s.id);
-                        return chunk?.agentId === agentFilter;
-                    });
-                }
-                if (vectorResults.length > 0) {
-                    const vectorItems = vectorResults.map((s) => ({
-                        chunkId: s.id,
-                        score: Math.max(0, 1 - s.distance),
-                        source: 'vector',
-                    }));
-                    fusedResults = fuseRRF([
-                        { items: fusedResults, weight: hybridSearch.keywordWeight },
-                        { items: vectorItems, weight: hybridSearch.vectorWeight },
-                    ], hybridSearch.rrfK);
-                }
-            }
-            catch (error) {
-                log.warn('Vector enrichment failed, using keyword results only', {
-                    error: error.message,
-                });
+function filterByAgent(items, agentFilter, projectFilter, getAgent) {
+    if (!agentFilter || projectFilter)
+        return items;
+    return items.filter((item) => getAgent(item.id) === agentFilter);
+}
+/**
+ * Extract entity mentions from the query and find matching chunks.
+ * Returns ranked items suitable for RRF fusion.
+ */
+function getEntityResults(query, projectFilter) {
+    const mentions = extractEntities(query);
+    if (mentions.length === 0)
+        return [];
+    const project = typeof projectFilter === 'string' ? projectFilter : undefined;
+    if (!project)
+        return []; // entity lookup requires project scope
+    const chunkIds = new Set();
+    for (const mention of mentions) {
+        const entities = findEntitiesByAlias(mention.normalizedName, mention.entityType, project);
+        for (const entity of entities) {
+            for (const cid of getChunkIdsForEntity(entity.id, 100)) {
+                chunkIds.add(cid);
             }
         }
-        if (fusedResults.length === 0) {
-            return {
-                text: '',
-                tokenCount: 0,
-                chunks: [],
-                totalConsidered: 0,
-                durationMs: Date.now() - startTime,
-                queryEmbedding,
-                seedIds: [],
-            };
+    }
+    return [...chunkIds].map((id, i) => ({
+        chunkId: id,
+        score: 1.0 / (i + 1),
+        source: 'entity',
+    }));
+}
+/**
+ * Merge entity-boosted results into fused results via RRF.
+ */
+function applyEntityBoost(fusedResults, query, projectFilter, rrfK) {
+    try {
+        const entityItems = getEntityResults(query, projectFilter);
+        if (entityItems.length > 0) {
+            return fuseRRF([
+                { items: fusedResults, weight: 1.0 },
+                { items: entityItems, weight: ENTITY_RRF_BOOST },
+            ], rrfK);
         }
-        // Skip cluster expansion for keyword-primary mode
     }
-    else {
-        // ── Hybrid/vector search path ────────────────────────────────────────
-        // Configure vector store for current model
-        vectorStore.setModelId(embeddingModel);
-        // 1. Embed query
-        const embedder = await getEmbedder(embeddingModel);
-        const queryResult = await embedder.embed(query, true);
-        queryEmbedding = queryResult.embedding;
-        // Determine whether to use index-based search
-        useIndexSearch = config.semanticIndex.useForSearch && getIndexEntryCount() > 0;
-        if (useIndexSearch) {
-            // ── Index-based search path ──────────────────────────────────────
-            indexVectorStore.setModelId(embeddingModel);
-            const entryCount = getIndexEntryCount();
-            const indexedChunks = getIndexedChunkCount();
-            const entriesPerChunk = indexedChunks > 0 ? entryCount / indexedChunks : 1;
-            const indexSearchLimit = Math.ceil(vectorSearchLimit * entriesPerChunk);
-            const indexVectorPromise = projectFilter
-                ? indexVectorStore.searchByProject(queryResult.embedding, projectFilter, indexSearchLimit, agentFilter)
-                : indexVectorStore.search(queryResult.embedding, indexSearchLimit);
-            let indexKeywordResults = [];
-            try {
-                indexKeywordResults = searchIndexEntriesByKeyword(query, hybridSearch.keywordSearchLimit, projectFilter, agentFilter);
-            }
-            catch (error) {
-                log.warn('Index keyword search unavailable', {
-                    error: error.message,
-                });
-            }
-            let indexSimilar = await indexVectorPromise;
-            if (agentFilter && !projectFilter) {
-                indexSimilar = indexSimilar.filter((s) => {
-                    const agent = indexVectorStore.getChunkAgent(s.id);
-                    return agent === agentFilter;
-                });
-                indexKeywordResults = indexKeywordResults.filter((r) => {
-                    const agent = indexVectorStore.getChunkAgent(r.id);
-                    return agent === agentFilter;
-                });
-            }
-            if (indexSimilar.length === 0 && indexKeywordResults.length === 0) {
-                return {
-                    text: '',
-                    tokenCount: 0,
-                    chunks: [],
-                    totalConsidered: 0,
-                    durationMs: Date.now() - startTime,
-                    queryEmbedding,
-                    seedIds: [],
-                };
-            }
-            const indexVectorItems = indexSimilar.map((s) => ({
-                chunkId: s.id,
-                score: Math.max(0, 1 - s.distance),
-                source: 'vector',
-            }));
-            const indexKeywordItems = indexKeywordResults.map((r) => ({
-                chunkId: r.id,
-                score: r.score,
-                source: 'keyword',
-            }));
-            const indexFused = fuseRRF([
-                { items: indexVectorItems, weight: hybridSearch.vectorWeight },
-                ...(indexKeywordItems.length > 0
-                    ? [{ items: indexKeywordItems, weight: hybridSearch.keywordWeight }]
-                    : []),
-            ], hybridSearch.rrfK);
-            const indexEntryIds = indexFused.map((r) => r.chunkId);
-            const chunkIds = dereferenceToChunkIds(indexEntryIds);
-            const chunkScoreMap = new Map();
-            for (const item of indexFused) {
-                const entryChunkIds = dereferenceToChunkIds([item.chunkId]);
-                for (const cid of entryChunkIds) {
-                    const existing = chunkScoreMap.get(cid);
-                    if (!existing || item.score > existing.score) {
-                        chunkScoreMap.set(cid, { score: item.score, source: item.source });
-                    }
-                }
+    catch (error) {
+        log.warn('Entity search failed', { error: error.message });
+    }
+    return fusedResults;
+}
+/**
+ * Keyword-primary retrieval path.
+ *
+ * keyword → [optional vector enrichment] → entity boost
+ * No cluster expansion.
+ */
+async function keywordPrimarySearch(query, projectFilter, agentFilter, vectorSearchLimit, config) {
+    const { hybridSearch, embeddingModel } = config;
+    let queryEmbedding = [];
+    let keywordResults = [];
+    try {
+        const keywordStore = getKeywordStore();
+        keywordResults = projectFilter
+            ? keywordStore.searchByProject(query, projectFilter, hybridSearch.keywordSearchLimit, agentFilter)
+            : keywordStore.search(query, hybridSearch.keywordSearchLimit);
+    }
+    catch (error) {
+        log.warn('Keyword search failed', { error: error.message });
+    }
+    // Post-filter by agent when no project filter was used
+    keywordResults = filterByAgent(keywordResults, agentFilter, projectFilter, (id) => {
+        const chunk = getChunkById(id);
+        return chunk?.agentId;
+    });
+    let fusedResults = keywordResults.map((r) => ({
+        chunkId: r.id,
+        score: r.score,
+        source: 'keyword',
+    }));
+    // Optional vector enrichment: merge vector results via RRF
+    if (config.vectorEnrichment) {
+        try {
+            vectorStore.setModelId(embeddingModel);
+            const embedder = await getEmbedder(embeddingModel);
+            const queryResult = await embedder.embed(query, true);
+            queryEmbedding = queryResult.embedding;
+            let vectorResults = await (projectFilter
+                ? vectorStore.searchByProject(queryResult.embedding, projectFilter, vectorSearchLimit, agentFilter)
+                : vectorStore.search(queryResult.embedding, vectorSearchLimit));
+            vectorResults = filterByAgent(vectorResults, agentFilter, projectFilter, (id) => {
+                const chunk = getChunkById(id);
+                return chunk?.agentId;
+            });
+            if (vectorResults.length > 0) {
+                const vectorItems = vectorResults.map((s) => ({
+                    chunkId: s.id,
+                    score: Math.max(0, 1 - s.distance),
+                    source: 'vector',
+                }));
+                fusedResults = fuseRRF([
+                    { items: fusedResults, weight: hybridSearch.keywordWeight },
+                    { items: vectorItems, weight: hybridSearch.vectorWeight },
+                ], hybridSearch.rrfK);
             }
-            fusedResults = chunkIds.map((cid) => {
-                const entry = chunkScoreMap.get(cid);
-                return {
-                    chunkId: cid,
-                    score: entry?.score ?? 0,
-                    source: entry?.source,
-                };
+        }
+        catch (error) {
+            log.warn('Vector enrichment failed, using keyword results only', {
+                error: error.message,
             });
         }
-        else {
-            // ── Chunk-based search path (fallback) ─────────────────────────────
-            const vectorSearchPromise = projectFilter
-                ? vectorStore.searchByProject(queryResult.embedding, projectFilter, vectorSearchLimit, agentFilter)
-                : vectorStore.search(queryResult.embedding, vectorSearchLimit);
-            let keywordResults = [];
-            try {
-                const keywordStore = getKeywordStore();
-                keywordResults = projectFilter
-                    ? keywordStore.searchByProject(query, projectFilter, hybridSearch.keywordSearchLimit, agentFilter)
-                    : keywordStore.search(query, hybridSearch.keywordSearchLimit);
-            }
-            catch (error) {
-                log.warn('Keyword search unavailable, falling back to vector-only', {
-                    error: error.message,
-                });
-            }
-            let similar = await vectorSearchPromise;
-            if (agentFilter && !projectFilter) {
-                similar = similar.filter((s) => {
-                    const chunk = getChunkById(s.id);
-                    return chunk?.agentId === agentFilter;
-                });
-                keywordResults = keywordResults.filter((r) => {
-                    const chunk = getChunkById(r.id);
-                    return chunk?.agentId === agentFilter;
-                });
-            }
-            if (similar.length === 0 && keywordResults.length === 0) {
-                return {
-                    text: '',
-                    tokenCount: 0,
-                    chunks: [],
-                    totalConsidered: 0,
-                    durationMs: Date.now() - startTime,
-                    queryEmbedding,
-                    seedIds: [],
-                };
+    }
+    // Entity boost
+    fusedResults = applyEntityBoost(fusedResults, query, projectFilter, hybridSearch.rrfK);
+    if (fusedResults.length === 0) {
+        return null;
+    }
+    return { fusedResults, queryEmbedding, useIndexSearch: false };
+}
+/**
+ * Index-based hybrid retrieval path.
+ *
+ * Uses semantic index entries (vector + keyword) → RRF → dereference to chunks.
+ */
+async function indexBasedSearch(queryEmbedding, query, projectFilter, agentFilter, vectorSearchLimit, config) {
+    const { hybridSearch, embeddingModel } = config;
+    indexVectorStore.setModelId(embeddingModel);
+    const entryCount = getIndexEntryCount();
+    const indexedChunks = getIndexedChunkCount();
+    const entriesPerChunk = indexedChunks > 0 ? entryCount / indexedChunks : 1;
+    const indexSearchLimit = Math.ceil(vectorSearchLimit * entriesPerChunk);
+    const indexVectorPromise = projectFilter
+        ? indexVectorStore.searchByProject(queryEmbedding, projectFilter, indexSearchLimit, agentFilter)
+        : indexVectorStore.search(queryEmbedding, indexSearchLimit);
+    let indexKeywordResults = [];
+    try {
+        indexKeywordResults = searchIndexEntriesByKeyword(query, hybridSearch.keywordSearchLimit, projectFilter, agentFilter);
+    }
+    catch (error) {
+        log.warn('Index keyword search unavailable', {
+            error: error.message,
+        });
+    }
+    let indexSimilar = await indexVectorPromise;
+    indexSimilar = filterByAgent(indexSimilar, agentFilter, projectFilter, (id) => indexVectorStore.getChunkAgent(id));
+    indexKeywordResults = filterByAgent(indexKeywordResults, agentFilter, projectFilter, (id) => indexVectorStore.getChunkAgent(id));
+    if (indexSimilar.length === 0 && indexKeywordResults.length === 0) {
+        return null;
+    }
+    const indexVectorItems = indexSimilar.map((s) => ({
+        chunkId: s.id,
+        score: Math.max(0, 1 - s.distance),
+        source: 'vector',
+    }));
+    const indexKeywordItems = indexKeywordResults.map((r) => ({
+        chunkId: r.id,
+        score: r.score,
+        source: 'keyword',
+    }));
+    const indexFused = fuseRRF([
+        { items: indexVectorItems, weight: hybridSearch.vectorWeight },
+        ...(indexKeywordItems.length > 0
+            ? [{ items: indexKeywordItems, weight: hybridSearch.keywordWeight }]
+            : []),
+    ], hybridSearch.rrfK);
+    const indexEntryIds = indexFused.map((r) => r.chunkId);
+    const chunkIds = dereferenceToChunkIds(indexEntryIds);
+    const chunkScoreMap = new Map();
+    for (const item of indexFused) {
+        const entryChunkIds = dereferenceToChunkIds([item.chunkId]);
+        for (const cid of entryChunkIds) {
+            const existing = chunkScoreMap.get(cid);
+            if (!existing || item.score > existing.score) {
+                chunkScoreMap.set(cid, { score: item.score, source: item.source });
             }
-            const vectorItems = similar.map((s) => ({
-                chunkId: s.id,
-                score: Math.max(0, 1 - s.distance),
-                source: 'vector',
-            }));
-            const keywordItems = keywordResults.map((r) => ({
-                chunkId: r.id,
-                score: r.score,
-                source: 'keyword',
-            }));
-            fusedResults = fuseRRF([
-                { items: vectorItems, weight: hybridSearch.vectorWeight },
-                ...(keywordItems.length > 0
-                    ? [{ items: keywordItems, weight: hybridSearch.keywordWeight }]
-                    : []),
-            ], hybridSearch.rrfK);
-        }
-        // Cluster expansion (hybrid/vector path only)
-        if (!skipClusters) {
-            fusedResults = expandViaClusters(fusedResults, clusterExpansion, projectFilter, agentFilter, config.feedbackWeight);
         }
     }
+    const fusedResults = chunkIds.map((cid) => {
+        const entry = chunkScoreMap.get(cid);
+        return {
+            chunkId: cid,
+            score: entry?.score ?? 0,
+            source: entry?.source,
+        };
+    });
+    return { fusedResults, queryEmbedding, useIndexSearch: true };
+}
+/**
+ * Chunk-based hybrid retrieval path (fallback when no semantic index).
+ *
+ * vector + keyword → RRF
+ */
+async function chunkBasedSearch(queryEmbedding, query, projectFilter, agentFilter, vectorSearchLimit, config) {
+    const { hybridSearch } = config;
+    const vectorSearchPromise = projectFilter
+        ? vectorStore.searchByProject(queryEmbedding, projectFilter, vectorSearchLimit, agentFilter)
+        : vectorStore.search(queryEmbedding, vectorSearchLimit);
+    let keywordResults = [];
+    try {
+        const keywordStore = getKeywordStore();
+        keywordResults = projectFilter
+            ? keywordStore.searchByProject(query, projectFilter, hybridSearch.keywordSearchLimit, agentFilter)
+            : keywordStore.search(query, hybridSearch.keywordSearchLimit);
+    }
+    catch (error) {
+        log.warn('Keyword search unavailable, falling back to vector-only', {
+            error: error.message,
+        });
+    }
+    let similar = await vectorSearchPromise;
+    similar = filterByAgent(similar, agentFilter, projectFilter, (id) => {
+        const chunk = getChunkById(id);
+        return chunk?.agentId;
+    });
+    keywordResults = filterByAgent(keywordResults, agentFilter, projectFilter, (id) => {
+        const chunk = getChunkById(id);
+        return chunk?.agentId;
+    });
+    if (similar.length === 0 && keywordResults.length === 0) {
+        return null;
+    }
+    const vectorItems = similar.map((s) => ({
+        chunkId: s.id,
+        score: Math.max(0, 1 - s.distance),
+        source: 'vector',
+    }));
+    const keywordItems = keywordResults.map((r) => ({
+        chunkId: r.id,
+        score: r.score,
+        source: 'keyword',
+    }));
+    const fusedResults = fuseRRF([
+        { items: vectorItems, weight: hybridSearch.vectorWeight },
+        ...(keywordItems.length > 0
+            ? [{ items: keywordItems, weight: hybridSearch.keywordWeight }]
+            : []),
+    ], hybridSearch.rrfK);
+    return { fusedResults, queryEmbedding, useIndexSearch: false };
+}
+/**
+ * Shared post-processing pipeline that all retrieval paths converge on.
+ *
+ * source tracking → seed extraction → dedupe → recency boost + length penalty →
+ * size bounding → MMR reranking → score normalization → budget assembly
+ */
+async function postProcessResults(fusedResults, opts) {
+    const { queryEmbedding, maxTokens, currentSessionId, config, useIndexSearch } = opts;
     const sourceMap = new Map();
     for (const item of fusedResults) {
         if (item.source && !sourceMap.has(item.chunkId)) {
@@ -336,7 +355,7 @@ export async function searchContext(request) {
         return tokens !== undefined && tokens <= maxTokens;
     });
     // MMR reranking (diversity-aware, budget-aware ordering)
-    const reordered = await reorderWithMMR(sizeBounded, queryEmbedding, mmrReranking, {
+    const reordered = await reorderWithMMR(sizeBounded, queryEmbedding, config.mmrReranking, {
         tokenBudget: maxTokens,
         chunkTokenCounts: chunkTokenMap,
     });
@@ -356,11 +375,89 @@ export async function searchContext(request) {
         tokenCount: assembled.tokenCount,
         chunks: assembled.includedChunks,
         totalConsidered: deduped.length,
-        durationMs: Date.now() - startTime,
-        queryEmbedding,
         seedIds,
     };
 }
+// ── Main orchestrator ────────────────────────────────────────────────────────
+/**
+ * Run the search pipeline.
+ *
+ * Keyword-primary mode: keyword → [optional vector enrichment] → recency → MMR → budget
+ * Hybrid mode:          embed → [vector, keyword] → RRF → cluster expand → recency → MMR → budget
+ */
+export async function searchContext(request) {
+    const startTime = Date.now();
+    const externalConfig = loadConfig();
+    const config = toRuntimeConfig(externalConfig);
+    const { query, currentSessionId, projectFilter, maxTokens = config.mcpMaxResponseTokens, vectorSearchLimit = 20, skipClusters = false, agentFilter, } = request;
+    const { embeddingModel } = config;
+    const retrievalMode = config.retrievalPrimary;
+    const emptyResponse = {
+        text: '',
+        tokenCount: 0,
+        chunks: [],
+        totalConsidered: 0,
+        durationMs: Date.now() - startTime,
+        queryEmbedding: [],
+        seedIds: [],
+    };
+    let result;
+    if (retrievalMode === 'keyword') {
+        // ── Keyword-primary search path ──────────────────────────────────────
+        result = await keywordPrimarySearch(query, projectFilter, agentFilter, vectorSearchLimit, config);
+        if (!result) {
+            emptyResponse.durationMs = Date.now() - startTime;
+            return emptyResponse;
+        }
+        // Skip cluster expansion for keyword-primary mode
+    }
+    else {
+        // ── Hybrid/vector search path ────────────────────────────────────────
+        // Configure vector store for current model
+        vectorStore.setModelId(embeddingModel);
+        // 1. Embed query
+        const embedder = await getEmbedder(embeddingModel);
+        const queryResult = await embedder.embed(query, true);
+        const queryEmbedding = queryResult.embedding;
+        // Determine whether to use index-based search
+        const useIndexSearch = config.semanticIndex.useForSearch && getIndexEntryCount() > 0;
+        if (useIndexSearch) {
+            result = await indexBasedSearch(queryEmbedding, query, projectFilter, agentFilter, vectorSearchLimit, config);
+        }
+        else {
+            result = await chunkBasedSearch(queryEmbedding, query, projectFilter, agentFilter, vectorSearchLimit, config);
+        }
+        if (!result) {
+            emptyResponse.queryEmbedding = queryEmbedding;
+            emptyResponse.durationMs = Date.now() - startTime;
+            return emptyResponse;
+        }
+        // Entity boost (hybrid/vector path)
+        result.fusedResults = applyEntityBoost(result.fusedResults, query, projectFilter, config.hybridSearch.rrfK);
+        // Cluster expansion (hybrid/vector path only)
+        if (!skipClusters) {
+            result.fusedResults = expandViaClusters(result.fusedResults, config.clusterExpansion, projectFilter, agentFilter, config.feedbackWeight);
+        }
+    }
+    // ── Shared post-processing ───────────────────────────────────────────
+    const processed = await postProcessResults(result.fusedResults, {
+        queryEmbedding: result.queryEmbedding,
+        maxTokens,
+        currentSessionId,
+        config,
+        useIndexSearch: result.useIndexSearch,
+    });
+    return {
+        text: processed.text,
+        tokenCount: processed.tokenCount,
+        chunks: processed.chunks,
+        totalConsidered: processed.totalConsidered,
+        durationMs: Date.now() - startTime,
+        queryEmbedding: result.queryEmbedding,
+        seedIds: processed.seedIds,
+    };
+}
+// ── Budget assembly ──────────────────────────────────────────────────────────
 /**
  * Formatting overhead constants.
  *