npm - aiwcli - Versions diffs - 0.12.6 → 0.12.7 - Mend

aiwcli 0.12.6 → 0.12.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

package/bin/dev.cmd +3 -3
package/bin/dev.js +16 -16
package/bin/run.cmd +3 -3
package/bin/run.js +21 -21
package/dist/commands/branch.js +7 -2
package/dist/lib/bmad-installer.js +37 -37
package/dist/lib/terminal.d.ts +2 -0
package/dist/lib/terminal.js +57 -7
package/dist/templates/CLAUDE.md +205 -205
package/dist/templates/_shared/.claude/commands/handoff-resume.md +12 -12
package/dist/templates/_shared/.claude/commands/handoff.md +12 -12
package/dist/templates/_shared/.claude/settings.json +65 -65
package/dist/templates/_shared/.codex/workflows/handoff.md +226 -226
package/dist/templates/_shared/.windsurf/workflows/handoff.md +226 -226
package/dist/templates/_shared/handoff-system/CLAUDE.md +421 -421
package/dist/templates/_shared/handoff-system/lib/document-generator.ts +215 -215
package/dist/templates/_shared/handoff-system/lib/handoff-reader.ts +158 -158
package/dist/templates/_shared/handoff-system/scripts/resume_handoff.ts +373 -373
package/dist/templates/_shared/handoff-system/scripts/save_handoff.ts +469 -469
package/dist/templates/_shared/handoff-system/workflows/handoff-resume.md +66 -66
package/dist/templates/_shared/handoff-system/workflows/handoff.md +254 -254
package/dist/templates/_shared/hooks-ts/_utils/git-state.ts +2 -2
package/dist/templates/_shared/hooks-ts/archive_plan.ts +159 -159
package/dist/templates/_shared/hooks-ts/context_monitor.ts +147 -147
package/dist/templates/_shared/hooks-ts/file-suggestion.ts +128 -128
package/dist/templates/_shared/hooks-ts/pre_compact.ts +49 -49
package/dist/templates/_shared/hooks-ts/session_end.ts +196 -196
package/dist/templates/_shared/hooks-ts/session_start.ts +163 -163
package/dist/templates/_shared/hooks-ts/task_create_capture.ts +48 -48
package/dist/templates/_shared/hooks-ts/task_update_capture.ts +74 -74
package/dist/templates/_shared/hooks-ts/user_prompt_submit.ts +93 -93
package/dist/templates/_shared/lib-ts/CLAUDE.md +367 -367
package/dist/templates/_shared/lib-ts/base/atomic-write.ts +138 -138
package/dist/templates/_shared/lib-ts/base/constants.ts +303 -303
package/dist/templates/_shared/lib-ts/base/git-state.ts +58 -58
package/dist/templates/_shared/lib-ts/base/hook-utils.ts +582 -582
package/dist/templates/_shared/lib-ts/base/inference.ts +301 -301
package/dist/templates/_shared/lib-ts/base/logger.ts +247 -247
package/dist/templates/_shared/lib-ts/base/state-io.ts +202 -202
package/dist/templates/_shared/lib-ts/base/stop-words.ts +184 -184
package/dist/templates/_shared/lib-ts/base/utils.ts +184 -184
package/dist/templates/_shared/lib-ts/context/context-formatter.ts +566 -566
package/dist/templates/_shared/lib-ts/context/context-selector.ts +524 -524
package/dist/templates/_shared/lib-ts/context/context-store.ts +712 -712
package/dist/templates/_shared/lib-ts/context/plan-manager.ts +312 -312
package/dist/templates/_shared/lib-ts/context/task-tracker.ts +185 -185
package/dist/templates/_shared/lib-ts/package.json +20 -20
package/dist/templates/_shared/lib-ts/templates/formatters.ts +102 -102
package/dist/templates/_shared/lib-ts/templates/plan-context.ts +58 -58
package/dist/templates/_shared/lib-ts/tsconfig.json +13 -13
package/dist/templates/_shared/lib-ts/types.ts +186 -186
package/dist/templates/_shared/scripts/resolve_context.ts +33 -33
package/dist/templates/_shared/scripts/status_line.ts +690 -690
package/dist/templates/cc-native/.claude/commands/cc-native/rlm/ask.md +136 -136
package/dist/templates/cc-native/.claude/commands/cc-native/rlm/index.md +21 -21
package/dist/templates/cc-native/.claude/commands/cc-native/rlm/overview.md +56 -56
package/dist/templates/cc-native/.claude/commands/cc-native/specdev.md +10 -10
package/dist/templates/cc-native/.windsurf/workflows/cc-native/fix.md +8 -8
package/dist/templates/cc-native/.windsurf/workflows/cc-native/implement.md +8 -8
package/dist/templates/cc-native/.windsurf/workflows/cc-native/research.md +8 -8
package/dist/templates/cc-native/CC-NATIVE-README.md +189 -189
package/dist/templates/cc-native/TEMPLATE-SCHEMA.md +304 -304
package/dist/templates/cc-native/_cc-native/agents/CLAUDE.md +143 -143
package/dist/templates/cc-native/_cc-native/agents/PLAN-ORCHESTRATOR.md +213 -213
package/dist/templates/cc-native/_cc-native/agents/plan-questions/PLAN-QUESTIONER.md +70 -70
package/dist/templates/cc-native/_cc-native/cc-native.config.json +96 -96
package/dist/templates/cc-native/_cc-native/hooks/CLAUDE.md +247 -247
package/dist/templates/cc-native/_cc-native/hooks/cc-native-plan-review.ts +76 -76
package/dist/templates/cc-native/_cc-native/hooks/enhance_plan_post_subagent.ts +54 -54
package/dist/templates/cc-native/_cc-native/hooks/enhance_plan_post_write.ts +51 -51
package/dist/templates/cc-native/_cc-native/hooks/mark_questions_asked.ts +53 -53
package/dist/templates/cc-native/_cc-native/hooks/plan_questions_early.ts +61 -61
package/dist/templates/cc-native/_cc-native/lib-ts/agent-selection.ts +163 -163
package/dist/templates/cc-native/_cc-native/lib-ts/aggregate-agents.ts +156 -156
package/dist/templates/cc-native/_cc-native/lib-ts/artifacts/format.ts +597 -597
package/dist/templates/cc-native/_cc-native/lib-ts/artifacts/index.ts +26 -26
package/dist/templates/cc-native/_cc-native/lib-ts/artifacts/tracker.ts +107 -107
package/dist/templates/cc-native/_cc-native/lib-ts/artifacts/write.ts +119 -119
package/dist/templates/cc-native/_cc-native/lib-ts/artifacts.ts +21 -21
package/dist/templates/cc-native/_cc-native/lib-ts/cc-native-state.ts +319 -319
package/dist/templates/cc-native/_cc-native/lib-ts/cli-output-parser.ts +144 -144
package/dist/templates/cc-native/_cc-native/lib-ts/config.ts +57 -57
package/dist/templates/cc-native/_cc-native/lib-ts/constants.ts +83 -83
package/dist/templates/cc-native/_cc-native/lib-ts/corroboration.ts +119 -119
package/dist/templates/cc-native/_cc-native/lib-ts/debug.ts +79 -79
package/dist/templates/cc-native/_cc-native/lib-ts/graduation.ts +132 -132
package/dist/templates/cc-native/_cc-native/lib-ts/index.ts +116 -116
package/dist/templates/cc-native/_cc-native/lib-ts/json-parser.ts +168 -168
package/dist/templates/cc-native/_cc-native/lib-ts/orchestrator.ts +70 -70
package/dist/templates/cc-native/_cc-native/lib-ts/output-builder.ts +130 -130
package/dist/templates/cc-native/_cc-native/lib-ts/plan-discovery.ts +80 -80
package/dist/templates/cc-native/_cc-native/lib-ts/plan-enhancement.ts +41 -41
package/dist/templates/cc-native/_cc-native/lib-ts/plan-questions.ts +101 -101
package/dist/templates/cc-native/_cc-native/lib-ts/review-pipeline.ts +511 -511
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/agent.ts +71 -71
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/base/base-agent.ts +217 -217
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/index.ts +12 -12
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/providers/claude-agent.ts +66 -66
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/providers/codex-agent.ts +184 -184
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/providers/gemini-agent.ts +39 -39
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/providers/orchestrator-claude-agent.ts +196 -196
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/schemas.ts +201 -201
package/dist/templates/cc-native/_cc-native/lib-ts/reviewers/types.ts +21 -21
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/CLAUDE.md +480 -480
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/embedding-indexer.ts +287 -287
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/hyde.ts +148 -148
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/index.ts +54 -54
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/logger.ts +58 -58
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/ollama-client.ts +208 -208
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/retrieval-pipeline.ts +460 -460
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/transcript-indexer.ts +446 -446
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/transcript-loader.ts +280 -280
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/transcript-searcher.ts +274 -274
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/types.ts +201 -201
package/dist/templates/cc-native/_cc-native/lib-ts/rlm/vector-store.ts +278 -278
package/dist/templates/cc-native/_cc-native/lib-ts/settings.ts +184 -184
package/dist/templates/cc-native/_cc-native/lib-ts/state.ts +275 -275
package/dist/templates/cc-native/_cc-native/lib-ts/tsconfig.json +18 -18
package/dist/templates/cc-native/_cc-native/lib-ts/types.ts +329 -329
package/dist/templates/cc-native/_cc-native/lib-ts/verdict.ts +72 -72
package/dist/templates/cc-native/_cc-native/workflows/specdev.md +9 -9
package/oclif.manifest.json +1 -1
package/package.json +108 -108
package/dist/templates/cc-native/_cc-native/lib-ts/nul +0 -3

package/dist/templates/cc-native/_cc-native/lib-ts/rlm/retrieval-pipeline.ts CHANGED Viewed

@@ -1,460 +1,460 @@
-#!/usr/bin/env bun
-/**
- * Retrieval Pipeline — Semantic search across session transcripts.
- *
- * Orchestrates a 4-stage pipeline:
- *   Stage 2: Embed query → KNN search → top chunks
- *   Stage 3: Parallel haiku summarizers per session
- *   Stage 4: Sonnet ranker → structured JSON per session
- *   Stage 5: Sonnet synthesizer → final markdown answer
- *
- * Usage:
- *   bun retrieval-pipeline.ts "query" [--top=20] [--project=name]
- */
-import { z } from "zod";
-import {
-  VECTOR_TOP_K,
-  MAX_PARALLEL_SUMMARIZERS,
-  HYDE_ENABLED,
-  HYDE_NUM_RESPONSES,
-  HYDE_MAX_TOKENS,
-  HYDE_TIMEOUT_MS,
-  HYDE_FALLBACK_TO_QUERY,
-  type VectorSearchResult,
-  type ChunkSummary,
-  type RankedSession,
-  type RetrievalResult,
-} from "./types.js";
-import { logInfo, logWarn, logError, logDebug } from "./logger.js";
-import { checkOllamaHealth, embedOne } from "./ollama-client.js";
-import { openVectorDb, searchKnn } from "./vector-store.js";
-import { loadTranscript } from "./transcript-loader.js";
-import { hydeQueryEmbedding } from "./hyde.js";
-const HOOK_NAME = "rlm_retrieve";
-// Dynamic import for inference (crosses package boundary)
-let inferenceAsync: typeof import("../../../../_shared/lib-ts/base/inference.js").inferenceAsync;
-try {
-  const mod = await import("../../../../_shared/lib-ts/base/inference.js");
-  inferenceAsync = mod.inferenceAsync;
-} catch {
-  // Fallback: warn and provide a stub that always fails
-  logWarn(HOOK_NAME, "Could not import inferenceAsync, AI stages will fail");
-  inferenceAsync = async () => ({
-    success: false,
-    output: "",
-    error: "inferenceAsync not available",
-    latency_ms: 0,
-  });
-}
-// Zod schema for AI ranking response
-const RankingItemSchema = z.object({
-  index: z.number(),
-  relevant: z.boolean(),
-  confidence: z.number(),
-  topics: z.array(z.string()),
-  key_findings: z.array(z.string()),
-});
-const RankingsSchema = z.array(RankingItemSchema);
-// ---------------------------------------------------------------------------
-// CLI entry
-// ---------------------------------------------------------------------------
-const args = process.argv.slice(2);
-const query = args.find((a) => !a.startsWith("--"));
-const topArg = args.find((a) => a.startsWith("--top="));
-const topK = topArg ? parseInt(topArg.split("=")[1], 10) : VECTOR_TOP_K;
-const projectArg = args.find((a) => a.startsWith("--project="));
-const projectFilter = projectArg ? projectArg.split("=")[1] : undefined;
-if (!query) {
-  process.stderr.write(
-    'Usage: bun retrieval-pipeline.ts "query" [--top=20] [--project=name]\n',
-  );
-  process.exitCode = 1;
-} else {
-  runPipeline(query, topK, projectFilter).catch((e) => {
-    logError(HOOK_NAME, `Fatal: ${e}`, { stderr: true });
-    process.exitCode = 1;
-  });
-}
-// ---------------------------------------------------------------------------
-// Pipeline orchestrator
-// ---------------------------------------------------------------------------
-async function runPipeline(
-  query: string,
-  topK: number,
-  project?: string,
-): Promise<void> {
-  const totalStart = Date.now();
-  const timings = {
-    embed_query_ms: 0,
-    vector_search_ms: 0,
-    summarize_ms: 0,
-    rank_ms: 0,
-    synthesize_ms: 0,
-    total_ms: 0,
-  };
-  // Pre-flight: check Ollama
-  const health = await checkOllamaHealth();
-  if (!health.ok) {
-    logError(HOOK_NAME, health.error ?? "Unknown Ollama health check error", { stderr: true });
-    process.exitCode = 1;
-    return;
-  }
-  // Stage 2: Embed query + KNN search
-  let t = Date.now();
-  let queryEmbedding: Float32Array;
-  let hydeTiming = 0;
-  if (HYDE_ENABLED) {
-    try {
-      const hydeStart = Date.now();
-      queryEmbedding = await hydeQueryEmbedding(query, {
-        numResponses: HYDE_NUM_RESPONSES,
-        maxTokens: HYDE_MAX_TOKENS,
-        timeout: HYDE_TIMEOUT_MS,
-        fallbackToQuery: HYDE_FALLBACK_TO_QUERY,
-      });
-      hydeTiming = Date.now() - hydeStart;
-      logInfo(HOOK_NAME, `HyDE query embedding completed in ${hydeTiming}ms`);
-    } catch (e) {
-      logWarn(HOOK_NAME, `HyDE failed: ${e}, falling back to direct query embedding`);
-      queryEmbedding = await embedOne(query);
-    }
-  } else {
-    queryEmbedding = await embedOne(query);
-  }
-  timings.embed_query_ms = Date.now() - t;
-  if (hydeTiming > 0) {
-    (timings as any).hyde_ms = hydeTiming;
-  }
-  t = Date.now();
-  const db = openVectorDb();
-  let results: VectorSearchResult[];
-  try {
-    results = searchKnn(db, queryEmbedding, topK, project);
-  } finally {
-    db.close();
-  }
-  timings.vector_search_ms = Date.now() - t;
-  if (results.length === 0) {
-    const empty: RetrievalResult = {
-      query,
-      synthesis:
-        "No results found. Suggestions:\n" +
-        "- Try a different query\n" +
-        "- Run `/rlm:embed-index` to build/refresh the vector index\n" +
-        "- Use `/rlm:search` for keyword-based fallback",
-      sources: [],
-      stage_timings: { ...timings, total_ms: Date.now() - totalStart },
-    };
-    process.stdout.write(JSON.stringify(empty, null, 2) + "\n");
-    return;
-  }
-  // Deduplicate by session_id (keep best chunk per session)
-  const sessionMap = new Map<
-    string,
-    { result: VectorSearchResult; chunks: VectorSearchResult[] }
-  >();
-  for (const r of results) {
-    const key = `${r.session_id}:${r.project}`;
-    const existing = sessionMap.get(key);
-    if (!existing) {
-      sessionMap.set(key, { result: r, chunks: [r] });
-    } else {
-      existing.chunks.push(r);
-      if (r.distance < existing.result.distance) {
-        existing.result = r;
-      }
-    }
-  }
-  const sessions = Array.from(sessionMap.values());
-  logInfo(
-    HOOK_NAME,
-    `Stage 2: ${results.length} chunks → ${sessions.length} sessions`,
-  );
-  // Stage 3: Parallel haiku summarization
-  t = Date.now();
-  const summaries = await summarizeSessions(query, sessions);
-  timings.summarize_ms = Date.now() - t;
-  if (summaries.length === 0) {
-    const noSummaries: RetrievalResult = {
-      query,
-      synthesis: "Found matching chunks but all summarization attempts failed.",
-      sources: [],
-      stage_timings: { ...timings, total_ms: Date.now() - totalStart },
-    };
-    process.stdout.write(JSON.stringify(noSummaries, null, 2) + "\n");
-    return;
-  }
-  // Stage 4: Sonnet ranking
-  t = Date.now();
-  const ranked = await rankSessions(query, summaries);
-  timings.rank_ms = Date.now() - t;
-  // Stage 5: Sonnet synthesis
-  t = Date.now();
-  const relevant = ranked.filter((r) => r.relevant);
-  let synthesis: string;
-  if (relevant.length > 0) {
-    synthesis = await synthesize(query, relevant, summaries);
-  } else {
-    synthesis =
-      "No sessions were deemed relevant to your query.\n" +
-      "Suggestions:\n" +
-      "- Try a different or broader query\n" +
-      "- Use `/rlm:search` for keyword-based fallback";
-  }
-  timings.synthesize_ms = Date.now() - t;
-  timings.total_ms = Date.now() - totalStart;
-  const output: RetrievalResult = {
-    query,
-    synthesis,
-    sources: ranked,
-    stage_timings: timings,
-  };
-  process.stdout.write(JSON.stringify(output, null, 2) + "\n");
-}
-// ---------------------------------------------------------------------------
-// Stage 3: Parallel haiku summarization
-// ---------------------------------------------------------------------------
-async function summarizeSessions(
-  query: string,
-  sessions: Array<{
-    result: VectorSearchResult;
-    chunks: VectorSearchResult[];
-  }>,
-): Promise<ChunkSummary[]> {
-  const results: ChunkSummary[] = [];
-  // Process in batches of MAX_PARALLEL_SUMMARIZERS
-  for (let i = 0; i < sessions.length; i += MAX_PARALLEL_SUMMARIZERS) {
-    const batch = sessions.slice(i, i + MAX_PARALLEL_SUMMARIZERS);
-    const promises = batch.map(async (session) => {
-      try {
-        return await summarizeOneSession(query, session);
-      } catch (e) {
-        logWarn(
-          HOOK_NAME,
-          `Summarize failed for ${session.result.session_id}: ${e}`,
-        );
-        return null;
-      }
-    });
-    const batchResults = await Promise.all(promises);
-    for (const r of batchResults) {
-      if (r) results.push(r);
-    }
-  }
-  return results;
-}
-async function summarizeOneSession(
-  query: string,
-  session: { result: VectorSearchResult; chunks: VectorSearchResult[] },
-): Promise<ChunkSummary | null> {
-  const best = session.result;
-  // Load transcript segment
-  let content: string;
-  try {
-    const loaded = await loadTranscript(
-      best.source_path,
-      [best.line_start, best.line_end],
-      4000,
-    );
-    content = loaded.content;
-  } catch {
-    content = `[Could not load transcript. Topic: ${best.topic}]`;
-  }
-  if (!content || content.length < 20) return null;
-  const systemPrompt =
-    "You are a session transcript summarizer. Extract ONLY information relevant to the query. " +
-    "Mention specific file names, function names, decisions made, and outcomes. " +
-    "If nothing in the transcript is relevant to the query, respond with exactly: Not relevant. " +
-    "Keep your summary under 200 words.";
-  const userPrompt =
-    `Query: ${query}\n\n` +
-    `Session: ${best.session_id} (${best.project}, ${best.date})\n` +
-    `Topic: ${best.topic}\n\n` +
-    `Transcript:\n${content}`;
-  const result = await inferenceAsync(systemPrompt, userPrompt, "fast", 30);
-  if (!result.success || !result.output) {
-    logWarn(HOOK_NAME, `Summarize inference failed: ${result.error}`);
-    return null;
-  }
-  if (result.output.trim().toLowerCase() === "not relevant.") {
-    return null;
-  }
-  return {
-    session_id: best.session_id,
-    project: best.project,
-    date: best.date,
-    segment_lines: [best.line_start, best.line_end],
-    summary: result.output.trim(),
-    source_path: best.source_path,
-  };
-}
-// ---------------------------------------------------------------------------
-// Stage 4: Sonnet ranking
-// ---------------------------------------------------------------------------
-async function rankSessions(
-  query: string,
-  summaries: ChunkSummary[],
-): Promise<RankedSession[]> {
-  const summaryText = summaries
-    .map(
-      (s, i) =>
-        `[${i + 1}] Session: ${s.session_id} | Project: ${s.project} | Date: ${s.date}\nSummary: ${s.summary}`,
-    )
-    .join("\n\n");
-  const systemPrompt =
-    "You are a session relevance ranker. Given a query and session summaries, " +
-    "evaluate each session's relevance. Output a JSON array where each element has:\n" +
-    '  { "index": number, "relevant": boolean, "confidence": number (0-1), "topics": string[], "key_findings": string[] }\n' +
-    "Output ONLY the JSON array, no other text.";
-  const userPrompt = `Query: ${query}\n\nSessions:\n${summaryText}`;
-  const result = await inferenceAsync(systemPrompt, userPrompt, "standard", 60);
-  if (!result.success || !result.output) {
-    logWarn(HOOK_NAME, `Rank inference failed: ${result.error}, marking all as relevant`);
-    return summaries.map((s) => ({
-      session_id: s.session_id,
-      project: s.project,
-      date: s.date,
-      relevant: true,
-      confidence: 0.3,
-      topics: [],
-      key_findings: [s.summary.slice(0, 200)],
-    }));
-  }
-  try {
-    // Extract JSON array from response (may be wrapped in markdown code blocks)
-    let jsonStr = result.output.trim();
-    const codeBlockMatch = jsonStr.match(/```(?:json)?\s*([\s\S]*?)```/);
-    if (codeBlockMatch) {
-      jsonStr = codeBlockMatch[1].trim();
-    }
-    const rawJson = JSON.parse(jsonStr);
-    const parseResult = RankingsSchema.safeParse(rawJson);
-    if (!parseResult.success) {
-      throw new Error(`Invalid ranking response format: ${parseResult.error.message}`);
-    }
-    const rankings = parseResult.data;
-    return rankings.map((r) => {
-      // Safe array indexing with bounds check
-      if (r.index < 1 || r.index > summaries.length) {
-        logWarn(HOOK_NAME, `Rank index ${r.index} out of bounds (1-${summaries.length})`);
-        return null;
-      }
-      const summary = summaries[r.index - 1];
-      return {
-        session_id: summary.session_id,
-        project: summary.project,
-        date: summary.date,
-        relevant: r.relevant,
-        confidence: r.confidence,
-        topics: r.topics,
-        key_findings: r.key_findings,
-      };
-    }).filter((r): r is RankedSession => r !== null);
-  } catch (e) {
-    logWarn(HOOK_NAME, `Rank parse failed: ${e}, marking all as relevant`);
-    return summaries.map((s) => ({
-      session_id: s.session_id,
-      project: s.project,
-      date: s.date,
-      relevant: true,
-      confidence: 0.3,
-      topics: [],
-      key_findings: [s.summary.slice(0, 200)],
-    }));
-  }
-}
-// ---------------------------------------------------------------------------
-// Stage 5: Sonnet synthesis
-// ---------------------------------------------------------------------------
-async function synthesize(
-  query: string,
-  relevant: RankedSession[],
-  summaries: ChunkSummary[],
-): Promise<string> {
-  // Build context from relevant sessions
-  const summaryMap = new Map(summaries.map((s) => [s.session_id, s]));
-  const context = relevant
-    .map((r) => {
-      const summary = summaryMap.get(r.session_id);
-      return (
-        `Session: ${r.session_id} | Project: ${r.project} | Date: ${r.date}\n` +
-        `Topics: ${r.topics.join(", ")}\n` +
-        `Key Findings: ${r.key_findings.join("; ")}\n` +
-        `Full Summary: ${summary?.summary ?? "(no summary)"}`
-      );
-    })
-    .join("\n\n---\n\n");
-  const systemPrompt =
-    "You are a knowledge synthesizer. Given a query and relevant session findings, " +
-    "produce a coherent markdown answer. Include session citations inline as " +
-    '"(session: {date}, {project})". Highlight the most recent and relevant information. ' +
-    "Note any contradictions or evolution across sessions. Be concise but thorough.";
-  const userPrompt = `Query: ${query}\n\nRelevant Sessions:\n${context}`;
-  const result = await inferenceAsync(systemPrompt, userPrompt, "standard", 60);
-  if (!result.success || !result.output) {
-    logWarn(HOOK_NAME, `Synthesize inference failed: ${result.error}`);
-    // Fallback: concatenate key findings
-    return relevant
-      .map(
-        (r) =>
-          `**${r.date} (${r.project}):** ${r.key_findings.join(". ")}`,
-      )
-      .join("\n\n");
-  }
-  return result.output.trim();
-}
+#!/usr/bin/env bun
+/**
+ * Retrieval Pipeline — Semantic search across session transcripts.
+ *
+ * Orchestrates a 4-stage pipeline:
+ *   Stage 2: Embed query → KNN search → top chunks
+ *   Stage 3: Parallel haiku summarizers per session
+ *   Stage 4: Sonnet ranker → structured JSON per session
+ *   Stage 5: Sonnet synthesizer → final markdown answer
+ *
+ * Usage:
+ *   bun retrieval-pipeline.ts "query" [--top=20] [--project=name]
+ */
+import { z } from "zod";
+import {
+  VECTOR_TOP_K,
+  MAX_PARALLEL_SUMMARIZERS,
+  HYDE_ENABLED,
+  HYDE_NUM_RESPONSES,
+  HYDE_MAX_TOKENS,
+  HYDE_TIMEOUT_MS,
+  HYDE_FALLBACK_TO_QUERY,
+  type VectorSearchResult,
+  type ChunkSummary,
+  type RankedSession,
+  type RetrievalResult,
+} from "./types.js";
+import { logInfo, logWarn, logError, logDebug } from "./logger.js";
+import { checkOllamaHealth, embedOne } from "./ollama-client.js";
+import { openVectorDb, searchKnn } from "./vector-store.js";
+import { loadTranscript } from "./transcript-loader.js";
+import { hydeQueryEmbedding } from "./hyde.js";
+const HOOK_NAME = "rlm_retrieve";
+// Dynamic import for inference (crosses package boundary)
+let inferenceAsync: typeof import("../../../../_shared/lib-ts/base/inference.js").inferenceAsync;
+try {
+  const mod = await import("../../../../_shared/lib-ts/base/inference.js");
+  inferenceAsync = mod.inferenceAsync;
+} catch {
+  // Fallback: warn and provide a stub that always fails
+  logWarn(HOOK_NAME, "Could not import inferenceAsync, AI stages will fail");
+  inferenceAsync = async () => ({
+    success: false,
+    output: "",
+    error: "inferenceAsync not available",
+    latency_ms: 0,
+  });
+}
+// Zod schema for AI ranking response
+const RankingItemSchema = z.object({
+  index: z.number(),
+  relevant: z.boolean(),
+  confidence: z.number(),
+  topics: z.array(z.string()),
+  key_findings: z.array(z.string()),
+});
+const RankingsSchema = z.array(RankingItemSchema);
+// ---------------------------------------------------------------------------
+// CLI entry
+// ---------------------------------------------------------------------------
+const args = process.argv.slice(2);
+const query = args.find((a) => !a.startsWith("--"));
+const topArg = args.find((a) => a.startsWith("--top="));
+const topK = topArg ? parseInt(topArg.split("=")[1], 10) : VECTOR_TOP_K;
+const projectArg = args.find((a) => a.startsWith("--project="));
+const projectFilter = projectArg ? projectArg.split("=")[1] : undefined;
+if (!query) {
+  process.stderr.write(
+    'Usage: bun retrieval-pipeline.ts "query" [--top=20] [--project=name]\n',
+  );
+  process.exitCode = 1;
+} else {
+  runPipeline(query, topK, projectFilter).catch((e) => {
+    logError(HOOK_NAME, `Fatal: ${e}`, { stderr: true });
+    process.exitCode = 1;
+  });
+}
+// ---------------------------------------------------------------------------
+// Pipeline orchestrator
+// ---------------------------------------------------------------------------
+async function runPipeline(
+  query: string,
+  topK: number,
+  project?: string,
+): Promise<void> {
+  const totalStart = Date.now();
+  const timings = {
+    embed_query_ms: 0,
+    vector_search_ms: 0,
+    summarize_ms: 0,
+    rank_ms: 0,
+    synthesize_ms: 0,
+    total_ms: 0,
+  };
+  // Pre-flight: check Ollama
+  const health = await checkOllamaHealth();
+  if (!health.ok) {
+    logError(HOOK_NAME, health.error ?? "Unknown Ollama health check error", { stderr: true });
+    process.exitCode = 1;
+    return;
+  }
+  // Stage 2: Embed query + KNN search
+  let t = Date.now();
+  let queryEmbedding: Float32Array;
+  let hydeTiming = 0;
+  if (HYDE_ENABLED) {
+    try {
+      const hydeStart = Date.now();
+      queryEmbedding = await hydeQueryEmbedding(query, {
+        numResponses: HYDE_NUM_RESPONSES,
+        maxTokens: HYDE_MAX_TOKENS,
+        timeout: HYDE_TIMEOUT_MS,
+        fallbackToQuery: HYDE_FALLBACK_TO_QUERY,
+      });
+      hydeTiming = Date.now() - hydeStart;
+      logInfo(HOOK_NAME, `HyDE query embedding completed in ${hydeTiming}ms`);
+    } catch (e) {
+      logWarn(HOOK_NAME, `HyDE failed: ${e}, falling back to direct query embedding`);
+      queryEmbedding = await embedOne(query);
+    }
+  } else {
+    queryEmbedding = await embedOne(query);
+  }
+  timings.embed_query_ms = Date.now() - t;
+  if (hydeTiming > 0) {
+    (timings as any).hyde_ms = hydeTiming;
+  }
+  t = Date.now();
+  const db = openVectorDb();
+  let results: VectorSearchResult[];
+  try {
+    results = searchKnn(db, queryEmbedding, topK, project);
+  } finally {
+    db.close();
+  }
+  timings.vector_search_ms = Date.now() - t;
+  if (results.length === 0) {
+    const empty: RetrievalResult = {
+      query,
+      synthesis:
+        "No results found. Suggestions:\n" +
+        "- Try a different query\n" +
+        "- Run `/rlm:embed-index` to build/refresh the vector index\n" +
+        "- Use `/rlm:search` for keyword-based fallback",
+      sources: [],
+      stage_timings: { ...timings, total_ms: Date.now() - totalStart },
+    };
+    process.stdout.write(JSON.stringify(empty, null, 2) + "\n");
+    return;
+  }
+  // Deduplicate by session_id (keep best chunk per session)
+  const sessionMap = new Map<
+    string,
+    { result: VectorSearchResult; chunks: VectorSearchResult[] }
+  >();
+  for (const r of results) {
+    const key = `${r.session_id}:${r.project}`;
+    const existing = sessionMap.get(key);
+    if (!existing) {
+      sessionMap.set(key, { result: r, chunks: [r] });
+    } else {
+      existing.chunks.push(r);
+      if (r.distance < existing.result.distance) {
+        existing.result = r;
+      }
+    }
+  }
+  const sessions = Array.from(sessionMap.values());
+  logInfo(
+    HOOK_NAME,
+    `Stage 2: ${results.length} chunks → ${sessions.length} sessions`,
+  );
+  // Stage 3: Parallel haiku summarization
+  t = Date.now();
+  const summaries = await summarizeSessions(query, sessions);
+  timings.summarize_ms = Date.now() - t;
+  if (summaries.length === 0) {
+    const noSummaries: RetrievalResult = {
+      query,
+      synthesis: "Found matching chunks but all summarization attempts failed.",
+      sources: [],
+      stage_timings: { ...timings, total_ms: Date.now() - totalStart },
+    };
+    process.stdout.write(JSON.stringify(noSummaries, null, 2) + "\n");
+    return;
+  }
+  // Stage 4: Sonnet ranking
+  t = Date.now();
+  const ranked = await rankSessions(query, summaries);
+  timings.rank_ms = Date.now() - t;
+  // Stage 5: Sonnet synthesis
+  t = Date.now();
+  const relevant = ranked.filter((r) => r.relevant);
+  let synthesis: string;
+  if (relevant.length > 0) {
+    synthesis = await synthesize(query, relevant, summaries);
+  } else {
+    synthesis =
+      "No sessions were deemed relevant to your query.\n" +
+      "Suggestions:\n" +
+      "- Try a different or broader query\n" +
+      "- Use `/rlm:search` for keyword-based fallback";
+  }
+  timings.synthesize_ms = Date.now() - t;
+  timings.total_ms = Date.now() - totalStart;
+  const output: RetrievalResult = {
+    query,
+    synthesis,
+    sources: ranked,
+    stage_timings: timings,
+  };
+  process.stdout.write(JSON.stringify(output, null, 2) + "\n");
+}
+// ---------------------------------------------------------------------------
+// Stage 3: Parallel haiku summarization
+// ---------------------------------------------------------------------------
+async function summarizeSessions(
+  query: string,
+  sessions: Array<{
+    result: VectorSearchResult;
+    chunks: VectorSearchResult[];
+  }>,
+): Promise<ChunkSummary[]> {
+  const results: ChunkSummary[] = [];
+  // Process in batches of MAX_PARALLEL_SUMMARIZERS
+  for (let i = 0; i < sessions.length; i += MAX_PARALLEL_SUMMARIZERS) {
+    const batch = sessions.slice(i, i + MAX_PARALLEL_SUMMARIZERS);
+    const promises = batch.map(async (session) => {
+      try {
+        return await summarizeOneSession(query, session);
+      } catch (e) {
+        logWarn(
+          HOOK_NAME,
+          `Summarize failed for ${session.result.session_id}: ${e}`,
+        );
+        return null;
+      }
+    });
+    const batchResults = await Promise.all(promises);
+    for (const r of batchResults) {
+      if (r) results.push(r);
+    }
+  }
+  return results;
+}
+async function summarizeOneSession(
+  query: string,
+  session: { result: VectorSearchResult; chunks: VectorSearchResult[] },
+): Promise<ChunkSummary | null> {
+  const best = session.result;
+  // Load transcript segment
+  let content: string;
+  try {
+    const loaded = await loadTranscript(
+      best.source_path,
+      [best.line_start, best.line_end],
+      4000,
+    );
+    content = loaded.content;
+  } catch {
+    content = `[Could not load transcript. Topic: ${best.topic}]`;
+  }
+  if (!content || content.length < 20) return null;
+  const systemPrompt =
+    "You are a session transcript summarizer. Extract ONLY information relevant to the query. " +
+    "Mention specific file names, function names, decisions made, and outcomes. " +
+    "If nothing in the transcript is relevant to the query, respond with exactly: Not relevant. " +
+    "Keep your summary under 200 words.";
+  const userPrompt =
+    `Query: ${query}\n\n` +
+    `Session: ${best.session_id} (${best.project}, ${best.date})\n` +
+    `Topic: ${best.topic}\n\n` +
+    `Transcript:\n${content}`;
+  const result = await inferenceAsync(systemPrompt, userPrompt, "fast", 30);
+  if (!result.success || !result.output) {
+    logWarn(HOOK_NAME, `Summarize inference failed: ${result.error}`);
+    return null;
+  }
+  if (result.output.trim().toLowerCase() === "not relevant.") {
+    return null;
+  }
+  return {
+    session_id: best.session_id,
+    project: best.project,
+    date: best.date,
+    segment_lines: [best.line_start, best.line_end],
+    summary: result.output.trim(),
+    source_path: best.source_path,
+  };
+}
+// ---------------------------------------------------------------------------
+// Stage 4: Sonnet ranking
+// ---------------------------------------------------------------------------
+async function rankSessions(
+  query: string,
+  summaries: ChunkSummary[],
+): Promise<RankedSession[]> {
+  const summaryText = summaries
+    .map(
+      (s, i) =>
+        `[${i + 1}] Session: ${s.session_id} | Project: ${s.project} | Date: ${s.date}\nSummary: ${s.summary}`,
+    )
+    .join("\n\n");
+  const systemPrompt =
+    "You are a session relevance ranker. Given a query and session summaries, " +
+    "evaluate each session's relevance. Output a JSON array where each element has:\n" +
+    '  { "index": number, "relevant": boolean, "confidence": number (0-1), "topics": string[], "key_findings": string[] }\n' +
+    "Output ONLY the JSON array, no other text.";
+  const userPrompt = `Query: ${query}\n\nSessions:\n${summaryText}`;
+  const result = await inferenceAsync(systemPrompt, userPrompt, "standard", 60);
+  if (!result.success || !result.output) {
+    logWarn(HOOK_NAME, `Rank inference failed: ${result.error}, marking all as relevant`);
+    return summaries.map((s) => ({
+      session_id: s.session_id,
+      project: s.project,
+      date: s.date,
+      relevant: true,
+      confidence: 0.3,
+      topics: [],
+      key_findings: [s.summary.slice(0, 200)],
+    }));
+  }
+  try {
+    // Extract JSON array from response (may be wrapped in markdown code blocks)
+    let jsonStr = result.output.trim();
+    const codeBlockMatch = jsonStr.match(/```(?:json)?\s*([\s\S]*?)```/);
+    if (codeBlockMatch) {
+      jsonStr = codeBlockMatch[1].trim();
+    }
+    const rawJson = JSON.parse(jsonStr);
+    const parseResult = RankingsSchema.safeParse(rawJson);
+    if (!parseResult.success) {
+      throw new Error(`Invalid ranking response format: ${parseResult.error.message}`);
+    }
+    const rankings = parseResult.data;
+    return rankings.map((r) => {
+      // Safe array indexing with bounds check
+      if (r.index < 1 || r.index > summaries.length) {
+        logWarn(HOOK_NAME, `Rank index ${r.index} out of bounds (1-${summaries.length})`);
+        return null;
+      }
+      const summary = summaries[r.index - 1];
+      return {
+        session_id: summary.session_id,
+        project: summary.project,
+        date: summary.date,
+        relevant: r.relevant,
+        confidence: r.confidence,
+        topics: r.topics,
+        key_findings: r.key_findings,
+      };
+    }).filter((r): r is RankedSession => r !== null);
+  } catch (e) {
+    logWarn(HOOK_NAME, `Rank parse failed: ${e}, marking all as relevant`);
+    return summaries.map((s) => ({
+      session_id: s.session_id,
+      project: s.project,
+      date: s.date,
+      relevant: true,
+      confidence: 0.3,
+      topics: [],
+      key_findings: [s.summary.slice(0, 200)],
+    }));
+  }
+}
+// ---------------------------------------------------------------------------
+// Stage 5: Sonnet synthesis
+// ---------------------------------------------------------------------------
+async function synthesize(
+  query: string,
+  relevant: RankedSession[],
+  summaries: ChunkSummary[],
+): Promise<string> {
+  // Build context from relevant sessions
+  const summaryMap = new Map(summaries.map((s) => [s.session_id, s]));
+  const context = relevant
+    .map((r) => {
+      const summary = summaryMap.get(r.session_id);
+      return (
+        `Session: ${r.session_id} | Project: ${r.project} | Date: ${r.date}\n` +
+        `Topics: ${r.topics.join(", ")}\n` +
+        `Key Findings: ${r.key_findings.join("; ")}\n` +
+        `Full Summary: ${summary?.summary ?? "(no summary)"}`
+      );
+    })
+    .join("\n\n---\n\n");
+  const systemPrompt =
+    "You are a knowledge synthesizer. Given a query and relevant session findings, " +
+    "produce a coherent markdown answer. Include session citations inline as " +
+    '"(session: {date}, {project})". Highlight the most recent and relevant information. ' +
+    "Note any contradictions or evolution across sessions. Be concise but thorough.";
+  const userPrompt = `Query: ${query}\n\nRelevant Sessions:\n${context}`;
+  const result = await inferenceAsync(systemPrompt, userPrompt, "standard", 60);
+  if (!result.success || !result.output) {
+    logWarn(HOOK_NAME, `Synthesize inference failed: ${result.error}`);
+    // Fallback: concatenate key findings
+    return relevant
+      .map(
+        (r) =>
+          `**${r.date} (${r.project}):** ${r.key_findings.join(". ")}`,
+      )
+      .join("\n\n");
+  }
+  return result.output.trim();
+}