npm - nlm-memory - Versions diffs - 0.5.0 → 0.5.2 - Mend

nlm-memory 0.5.0 → 0.5.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (257) hide show

package/README.md +89 -34
package/dist/cli/digest.d.ts +20 -0
package/dist/cli/digest.js +142 -0
package/dist/cli/digest.js.map +1 -0
package/dist/cli/nlm.d.ts +1 -0
package/dist/cli/nlm.js +25 -1
package/dist/cli/nlm.js.map +1 -1
package/dist/core/digest/compose.d.ts +38 -0
package/dist/core/digest/compose.js +93 -0
package/dist/core/digest/compose.js.map +1 -0
package/dist/core/digest/hook-liveness.d.ts +32 -0
package/dist/core/digest/hook-liveness.js +54 -0
package/dist/core/digest/hook-liveness.js.map +1 -0
package/dist/http/app.js +2 -1
package/dist/http/app.js.map +1 -1
package/dist/mcp/server.js +20 -1
package/dist/mcp/server.js.map +1 -1
package/dist/ui/assets/{index-C8cpwbYJ.css → index-Beo8psd-.css} +1 -1
package/dist/ui/assets/{index-CB50QnL-.js → index-CSPTTeeM.js} +8 -8
package/dist/ui/index.html +2 -2
package/package.json +26 -1
package/.agents/plugins/marketplace.json +0 -20
package/.github/workflows/ci.yml +0 -30
package/docs/methodology/re-derivation-rate.md +0 -112
package/docs/methodology/useful-hit-rate.md +0 -79
package/docs/plans/2026-05-20-fts5-lexical-recall.md +0 -1088
package/docs/plans/2026-05-20-recall-daemon-wedge-fix.md +0 -662
package/docs/plans/2026-05-20-recall-hook-design.md +0 -131
package/docs/plans/2026-05-20-recall-hook-implementation.md +0 -1222
package/docs/plans/desktop-product.md +0 -69
package/docs/plans/factstore-design.md +0 -236
package/logs/CHANGELOG/CHANGELOG-2026.md +0 -1575
package/logs/CHANGELOG/CHANGELOG.md +0 -209
package/migrations/000_initial_schema.sql +0 -174
package/migrations/001_entity_type_rename.sql +0 -17
package/migrations/002_adapter_state_extend.sql +0 -12
package/migrations/003_session_embeddings.sql +0 -11
package/migrations/004_facts.sql +0 -46
package/migrations/005_sources.sql +0 -31
package/migrations/006_providers.sql +0 -33
package/migrations/007_source_tokens.sql +0 -17
package/migrations/008_fts_rebuild.sql +0 -9
package/migrations/009_session_embedding_chunks.sql +0 -46
package/migrations/010_sources_opencode.sql +0 -30
package/migrations/011_sources_hermes_agent.sql +0 -30
package/migrations/012_sources_aider.sql +0 -30
package/migrations/013_adapter_state_failure_count.sql +0 -12
package/migrations/014_sources_cursor.sql +0 -30
package/migrations/015_sources_windsurf.sql +0 -30
package/plugin-hermes-agent/README.md +0 -49
package/plugin-hermes-agent/__init__.py +0 -75
package/plugin-hermes-agent/plugin.yaml +0 -15
package/scripts/backfill-citations.mjs +0 -0
package/scripts/build-codex-plugin.mjs +0 -61
package/scripts/deepseek-probe.mjs +0 -67
package/scripts/extract-triples.mjs +0 -207
package/scripts/longmemeval/embedding-cache.ts +0 -77
package/scripts/longmemeval/fetch-dataset.sh +0 -25
package/scripts/longmemeval/run-harness.ts +0 -315
package/scripts/longmemeval/scorer.ts +0 -99
package/scripts/longmemeval/tsconfig.json +0 -9
package/scripts/longmemeval/types.ts +0 -35
package/scripts/nlm-daily-digest.py +0 -239
package/scripts/nlm-daily-digest.sh +0 -28
package/src/cli/classify-parity.ts +0 -257
package/src/cli/launchctl-helpers.ts +0 -49
package/src/cli/nlm.ts +0 -1078
package/src/core/actions/actions-log.ts +0 -118
package/src/core/actions/overlay.ts +0 -117
package/src/core/adapters/aider.ts +0 -205
package/src/core/adapters/claude-code.ts +0 -293
package/src/core/adapters/common.ts +0 -54
package/src/core/adapters/cursor.ts +0 -486
package/src/core/adapters/from-source.ts +0 -67
package/src/core/adapters/hermes-agent.ts +0 -240
package/src/core/adapters/hermes.ts +0 -277
package/src/core/adapters/jsonl-generic.ts +0 -208
package/src/core/adapters/opencode.ts +0 -281
package/src/core/adapters/pi.ts +0 -264
package/src/core/adapters/windsurf.ts +0 -386
package/src/core/classifier/prompt.ts +0 -200
package/src/core/dataset/build-dataset.ts +0 -463
package/src/core/embedding/chunk-body.ts +0 -76
package/src/core/embedding/embed-backfill.ts +0 -210
package/src/core/embedding/embed-normalize.ts +0 -135
package/src/core/facts/backfill-facts.ts +0 -254
package/src/core/facts/extract-facts.ts +0 -50
package/src/core/hook/citation-detect.ts +0 -124
package/src/core/hook/cite-memo.ts +0 -68
package/src/core/hook/claude-settings.ts +0 -187
package/src/core/hook/gate.ts +0 -25
package/src/core/hook/hook-log.ts +0 -41
package/src/core/hook/memo-sweep.ts +0 -164
package/src/core/hook/memo.ts +0 -67
package/src/core/hook/pointer-block.ts +0 -26
package/src/core/hook/select.ts +0 -32
package/src/core/hook/transcript.ts +0 -121
package/src/core/ingest/ingest-session.ts +0 -111
package/src/core/providers/provider-models.ts +0 -100
package/src/core/providers/provider-registry.ts +0 -196
package/src/core/recall/citation-log.ts +0 -108
package/src/core/recall/filter.ts +0 -27
package/src/core/recall/index.ts +0 -6
package/src/core/recall/match-fields.ts +0 -40
package/src/core/recall/query-log.ts +0 -149
package/src/core/recall/query-shape.ts +0 -66
package/src/core/recall/recall-service.ts +0 -320
package/src/core/recall/recent-log.ts +0 -59
package/src/core/recall/tokenize.ts +0 -18
package/src/core/recall/useful-scan.ts +0 -336
package/src/core/recall-facts/fact-query-log.ts +0 -150
package/src/core/recall-facts/fact-recall-service.ts +0 -327
package/src/core/scheduler/scan-once.ts +0 -142
package/src/core/scheduler/scheduler.ts +0 -225
package/src/core/sources/source-registry.ts +0 -278
package/src/core/storage/db-restore.ts +0 -133
package/src/core/storage/live-status.ts +0 -45
package/src/core/storage/migrate.ts +0 -72
package/src/core/storage/sqlite-fact-store.ts +0 -304
package/src/core/storage/sqlite-session-store.ts +0 -810
package/src/hook/hook-auth.ts +0 -18
package/src/hook/prompt-recall-hook.ts +0 -180
package/src/hook/session-end-hook.ts +0 -81
package/src/hook/session-start-hook.ts +0 -168
package/src/hook/stop-hook.ts +0 -239
package/src/http/app.ts +0 -1215
package/src/install/claude-code.ts +0 -128
package/src/install/codex.ts +0 -367
package/src/install/cursor.ts +0 -68
package/src/install/hermes-agent.ts +0 -76
package/src/install/hermes.ts +0 -78
package/src/install/nlm-dir-perms.ts +0 -55
package/src/install/ollama.ts +0 -284
package/src/install/setup.ts +0 -489
package/src/install/windsurf.ts +0 -68
package/src/llm/classifier-box.ts +0 -64
package/src/llm/deepseek-client.ts +0 -150
package/src/llm/env-autoload.ts +0 -55
package/src/llm/ollama-client.ts +0 -189
package/src/mcp/server.ts +0 -534
package/src/ports/fact-store.ts +0 -102
package/src/ports/llm-client.ts +0 -52
package/src/ports/logger.ts +0 -16
package/src/ports/session-store.ts +0 -45
package/src/ports/transcript-adapter.ts +0 -55
package/src/shared/types.ts +0 -149
package/src/ui/App.tsx +0 -58
package/src/ui/components/PromoteOpenButton.tsx +0 -65
package/src/ui/components/SessionDrawer.tsx +0 -199
package/src/ui/components/SideNav.tsx +0 -162
package/src/ui/components/Skeleton.tsx +0 -107
package/src/ui/index.html +0 -13
package/src/ui/lib/actions.ts +0 -30
package/src/ui/lib/api.ts +0 -92
package/src/ui/lib/dataset.ts +0 -141
package/src/ui/lib/registries.ts +0 -155
package/src/ui/lib/view-settings.ts +0 -41
package/src/ui/main.tsx +0 -15
package/src/ui/pages/Live.tsx +0 -229
package/src/ui/pages/Pulse.tsx +0 -415
package/src/ui/pages/Recall.tsx +0 -190
package/src/ui/pages/River.tsx +0 -354
package/src/ui/pages/Search.tsx +0 -386
package/src/ui/pages/Stub.tsx +0 -9
package/src/ui/pages/Thread.tsx +0 -473
package/src/ui/pages/settings/Classifier.tsx +0 -227
package/src/ui/pages/settings/Data.tsx +0 -190
package/src/ui/pages/settings/Index.tsx +0 -65
package/src/ui/pages/settings/Labels.tsx +0 -224
package/src/ui/pages/settings/Providers.tsx +0 -305
package/src/ui/pages/settings/SettingsSubnav.tsx +0 -28
package/src/ui/pages/settings/Sources.tsx +0 -326
package/src/ui/pages/settings/Views.tsx +0 -96
package/src/ui/styles.css +0 -1890
package/src/ui/tsconfig.json +0 -21
package/src/ui/vite.config.ts +0 -19
package/tests/fixtures/claude_code/short_session.jsonl +0 -2
package/tests/fixtures/claude_code/standard_iso.jsonl +0 -4
package/tests/fixtures/claude_code/tool_heavy.jsonl +0 -8
package/tests/fixtures/claude_code/with_subagent.jsonl +0 -7
package/tests/fixtures/facts.ts +0 -17
package/tests/fixtures/golden-corpus.ts +0 -85
package/tests/fixtures/hermes/paired_request_dump.json +0 -24
package/tests/fixtures/hermes/paired_session.json +0 -23
package/tests/fixtures/hermes/request_dump.json +0 -28
package/tests/fixtures/hermes/session_iso.json +0 -38
package/tests/fixtures/hermes/session_unix.json +0 -38
package/tests/fixtures/hermes/system_only.json +0 -18
package/tests/fixtures/pi/error-connection-abort.jsonl +0 -8
package/tests/fixtures/pi/short-successful.jsonl +0 -5
package/tests/fixtures/pi/with-custom-message.jsonl +0 -6
package/tests/fixtures/sessions.ts +0 -22
package/tests/integration/backfill-facts.test.ts +0 -362
package/tests/integration/citation-explicit.test.ts +0 -111
package/tests/integration/cite-event.test.ts +0 -169
package/tests/integration/cite-memo.test.ts +0 -87
package/tests/integration/db-restore.test.ts +0 -153
package/tests/integration/embed-backfill.test.ts +0 -176
package/tests/integration/fact-supersedence.test.ts +0 -313
package/tests/integration/fts-index.test.ts +0 -60
package/tests/integration/getbyids-sqlite.test.ts +0 -100
package/tests/integration/hermes-agent-hooks.test.ts +0 -248
package/tests/integration/hook-claude-settings.test.ts +0 -218
package/tests/integration/hook-log.test.ts +0 -54
package/tests/integration/hook-memo.test.ts +0 -68
package/tests/integration/hook-pre-compact.test.ts +0 -105
package/tests/integration/hook-subagent-start.test.ts +0 -102
package/tests/integration/http.test.ts +0 -401
package/tests/integration/keyword-search-fts.test.ts +0 -66
package/tests/integration/mcp-recall-logging.test.ts +0 -88
package/tests/integration/mcp.test.ts +0 -260
package/tests/integration/memo-sweep.test.ts +0 -91
package/tests/integration/prompt-recall-hook.test.ts +0 -88
package/tests/integration/provider-registry.test.ts +0 -107
package/tests/integration/recall-golden.test.ts +0 -59
package/tests/integration/recall-sqlite.test.ts +0 -169
package/tests/integration/scheduler.test.ts +0 -391
package/tests/integration/session-end-hook.test.ts +0 -48
package/tests/integration/session-start-hook.test.ts +0 -126
package/tests/integration/source-registry.test.ts +0 -122
package/tests/integration/sqlite-fact-store.test.ts +0 -346
package/tests/integration/stop-hook.test.ts +0 -560
package/tests/integration/wal-checkpoint.test.ts +0 -49
package/tests/unit/cli/launchctl-helpers.test.ts +0 -60
package/tests/unit/core/adapters/aider.test.ts +0 -230
package/tests/unit/core/adapters/claude-code.test.ts +0 -118
package/tests/unit/core/adapters/cursor.test.ts +0 -485
package/tests/unit/core/adapters/hermes-agent.test.ts +0 -329
package/tests/unit/core/adapters/hermes.test.ts +0 -81
package/tests/unit/core/adapters/jsonl-generic.test.ts +0 -142
package/tests/unit/core/adapters/opencode.test.ts +0 -354
package/tests/unit/core/adapters/pi.test.ts +0 -110
package/tests/unit/core/adapters/windsurf.test.ts +0 -416
package/tests/unit/core/classifier/prompt.test.ts +0 -126
package/tests/unit/core/embedding/chunk-body.test.ts +0 -100
package/tests/unit/core/facts/extract-facts.test.ts +0 -117
package/tests/unit/core/filter.test.ts +0 -40
package/tests/unit/core/hook/citation-detect-cite-session.test.ts +0 -96
package/tests/unit/core/hook/citation-detect.test.ts +0 -124
package/tests/unit/core/hook/gate.test.ts +0 -29
package/tests/unit/core/hook/pointer-block.test.ts +0 -22
package/tests/unit/core/hook/select.test.ts +0 -66
package/tests/unit/core/match-fields.test.ts +0 -39
package/tests/unit/core/mcp-cite-session.test.ts +0 -51
package/tests/unit/core/providers/provider-models.test.ts +0 -101
package/tests/unit/core/query-shape.test.ts +0 -92
package/tests/unit/core/recall-facts/fact-recall-service.test.ts +0 -258
package/tests/unit/core/recall-service.test.ts +0 -200
package/tests/unit/core/storage/live-status.test.ts +0 -54
package/tests/unit/core/tokenize.test.ts +0 -32
package/tests/unit/core/useful-scan.test.ts +0 -537
package/tests/unit/llm/embed.test.ts +0 -93
package/tests/unit/llm/ollama-client.test.ts +0 -124
package/tests/unit/scripts/longmemeval-scorer.test.ts +0 -114
package/tsconfig.json +0 -31
package/tsconfig.test.json +0 -11
package/vitest.config.ts +0 -22

package/src/llm/deepseek-client.ts DELETED Viewed

@@ -1,150 +0,0 @@
-/**
- * DeepSeekClient — LLMClient backed by DeepSeek's OpenAI-compatible chat API.
- *
- * Use case (per Python notes confirmed 2026-05-07 / 2026-05-13):
- *   • v4-flash handles inputs up to ~60K chars reliably; we cap at 30K to
- *     stay well inside the deterministic zone.
- *   • ~$0.002/session at typical sizes — full backfill of ~1,200 sessions
- *     ≈ $2.50.
- *   • Strong extraction quality (12+ entities, accurate decisions,
- *     0.9 confidence) where phi4-mini struggles or times out.
- *
- * Same prompt module as OllamaClient — only the transport differs. Same
- * error semantics: LLMUnreachableError for network/HTTP, ClassifierSchemaError
- * for unparseable / shape-wrong output. Reads DEEPSEEK_API_KEY at construct
- * time unless an explicit key is passed.
- *
- * Embedding is not supported by DeepSeek's API — `embed()` throws. Wire a
- * separate embedder (OllamaClient) for semantic recall.
- */
-import type {
-  ClassifyResult,
-  EmbedResult,
-  EmbeddingKind,
-  LLMClient,
-} from "@ports/llm-client.js";
-import { LLMUnreachableError } from "@ports/llm-client.js";
-import {
-  CLASSIFIER_SYSTEM_PROMPT,
-  buildUserPrompt,
-  coerceClassifyResult,
-  stripJsonFences,
-  validateClassifierJson,
-} from "@core/classifier/prompt.js";
-import { ClassifierSchemaError } from "./ollama-client.js";
-export type FetchImpl = typeof fetch;
-export interface DeepSeekClientOptions {
-  readonly apiKey?: string;
-  readonly baseUrl?: string;
-  readonly classifyModel?: string;
-  readonly classifyTimeoutMs?: number;
-  readonly maxTranscriptChars?: number;
-  readonly fetchImpl?: FetchImpl;
-}
-interface ChatResponse {
-  readonly choices?: ReadonlyArray<{ readonly message?: { readonly content?: string } }>;
-}
-export class DeepSeekClient implements LLMClient {
-  private readonly apiKey: string;
-  private readonly baseUrl: string;
-  private readonly classifyModel: string;
-  private readonly classifyTimeoutMs: number;
-  private readonly maxTranscriptChars: number;
-  private readonly fetchImpl: FetchImpl;
-  constructor(opts: DeepSeekClientOptions = {}) {
-    const key = opts.apiKey ?? process.env["DEEPSEEK_API_KEY"];
-    if (!key) {
-      throw new Error(
-        "DEEPSEEK_API_KEY not set. Export it, place it in ~/.nlm/.env, or pass apiKey explicitly.",
-      );
-    }
-    this.apiKey = key;
-    this.baseUrl = (opts.baseUrl ?? "https://api.deepseek.com/v1").replace(/\/+$/, "");
-    this.classifyModel = opts.classifyModel ?? "deepseek-v4-flash";
-    this.classifyTimeoutMs = opts.classifyTimeoutMs ?? 180_000;
-    this.maxTranscriptChars = opts.maxTranscriptChars ?? 30_000;
-    this.fetchImpl = opts.fetchImpl ?? fetch;
-  }
-  async embed(_text: string, _kind: EmbeddingKind): Promise<EmbedResult> {
-    throw new Error(
-      "DeepSeekClient.embed not supported — DeepSeek's API has no embeddings endpoint. Wire OllamaClient for embeddings.",
-    );
-  }
-  async classify(transcript: string, priorContext: string = ""): Promise<ClassifyResult> {
-    const controller = new AbortController();
-    const timer = setTimeout(() => controller.abort(), this.classifyTimeoutMs);
-    try {
-      // DeepSeek's reliable zone is ≤30K, narrower than the prompt module's
-      // 15K default. We pre-truncate to our wider cap to feed the model more
-      // context than Ollama can handle, then buildUserPrompt's own truncation
-      // is a no-op.
-      const sized =
-        transcript.length <= this.maxTranscriptChars
-          ? transcript
-          : transcript.slice(0, this.maxTranscriptChars / 2 - 40) +
-            "\n\n[... transcript truncated; below is the closing portion ...]\n\n" +
-            transcript.slice(transcript.length - this.maxTranscriptChars / 2 + 40);
-      const userPrompt = buildUserPrompt(sized, priorContext);
-      const res = await this.fetchImpl(`${this.baseUrl}/chat/completions`, {
-        method: "POST",
-        headers: {
-          "Content-Type": "application/json",
-          Authorization: `Bearer ${this.apiKey}`,
-        },
-        body: JSON.stringify({
-          model: this.classifyModel,
-          messages: [
-            { role: "system", content: CLASSIFIER_SYSTEM_PROMPT },
-            { role: "user", content: userPrompt },
-          ],
-          response_format: { type: "json_object" },
-          temperature: 0.1,
-          // 8192 covers reasoning + JSON output. deepseek-v4-flash is a
-          // reasoning model — its hidden chain-of-thought counts against
-          // max_tokens but never reaches `content`. At 1024 the reasoning
-          // consumed the entire budget and the JSON output came back empty
-          // (finish_reason: length, content: ""). Backfill verified ~72% of
-          // real claude-code sessions hit that mode at 1024. Real-world
-          // observed reasoning_tokens: ~900-1100; JSON body adds 200-1000
-          // depending on facts/entity counts. 8192 leaves headroom.
-          max_tokens: 8192,
-          stream: false,
-        }),
-        signal: controller.signal,
-      });
-      if (!res.ok) {
-        throw new LLMUnreachableError(
-          "deepseek",
-          `status ${res.status}: ${await res.text().catch(() => "")}`,
-        );
-      }
-      const data = (await res.json()) as ChatResponse;
-      const rawContent = data.choices?.[0]?.message?.content?.trim() ?? "";
-      const content = stripJsonFences(rawContent);
-      let parsed: unknown;
-      try {
-        parsed = JSON.parse(content);
-      } catch {
-        throw new ClassifierSchemaError("deepseek returned non-JSON content");
-      }
-      if (!validateClassifierJson(parsed)) {
-        throw new ClassifierSchemaError("deepseek response missing required keys");
-      }
-      return coerceClassifyResult(parsed);
-    } catch (e) {
-      if (e instanceof LLMUnreachableError || e instanceof ClassifierSchemaError) throw e;
-      throw new LLMUnreachableError("deepseek", e);
-    } finally {
-      clearTimeout(timer);
-    }
-  }
-}

package/src/llm/env-autoload.ts DELETED Viewed

@@ -1,55 +0,0 @@
-/**
- * Mirror of `classifier.autoload_env` from the Python daemon. Reads KEY=VALUE
- * pairs from a small list of likely .env locations into process.env. Existing
- * env vars are NOT overridden.
- *
- * Returns the list of paths actually loaded. Safe to call multiple times.
- */
-import { readFileSync, existsSync } from "node:fs";
-import { homedir } from "node:os";
-import { resolve } from "node:path";
-const DEFAULT_SEARCH_PATHS = [
-  "~/.nlm/.env",
-  "./.env",
-  "../.env",
-  "../../.env",
-];
-function expandHome(p: string): string {
-  if (p.startsWith("~/")) return resolve(homedir(), p.slice(2));
-  return p;
-}
-export function autoloadEnv(extraPaths: ReadonlyArray<string> = []): string[] {
-  const loaded: string[] = [];
-  const paths = [...DEFAULT_SEARCH_PATHS, ...extraPaths];
-  for (const raw of paths) {
-    const path = expandHome(raw);
-    if (!existsSync(path)) continue;
-    try {
-      const content = readFileSync(path, "utf8");
-      for (const line of content.split("\n")) {
-        const trimmed = line.trim();
-        if (!trimmed || trimmed.startsWith("#") || !trimmed.includes("=")) continue;
-        const eq = trimmed.indexOf("=");
-        const key = trimmed.slice(0, eq).trim();
-        let value = trimmed.slice(eq + 1).trim();
-        if (
-          (value.startsWith('"') && value.endsWith('"')) ||
-          (value.startsWith("'") && value.endsWith("'"))
-        ) {
-          value = value.slice(1, -1);
-        }
-        if (key && process.env[key] === undefined) {
-          process.env[key] = value;
-        }
-      }
-      loaded.push(path);
-    } catch {
-      continue;
-    }
-  }
-  return loaded;
-}

package/src/llm/ollama-client.ts DELETED Viewed

@@ -1,189 +0,0 @@
-/**
- * OllamaClient — LLMClient backed by a local Ollama HTTP endpoint.
- *
- * embed()    → POST /api/embeddings  (nomic-embed-text by default)
- * classify() → POST /api/chat        (phi4-mini by default, format=json)
- *
- * Network/HTTP failure maps to LLMUnreachableError so RecallService can
- * degrade to keyword mode without crashing. Classification parse failures
- * resolve to null (caller's choice whether to retry or route to inbox).
- *
- * Layering: this file lives in the outer ring. core/ depends on LLMClient,
- * not on this concrete class. Tests can substitute a fake client.
- */
-import type {
-  ClassifyResult,
-  EmbedResult,
-  EmbeddingKind,
-  LLMClient,
-} from "@ports/llm-client.js";
-import { LLMUnreachableError } from "@ports/llm-client.js";
-import {
-  CLASSIFIER_SYSTEM_PROMPT,
-  buildUserPrompt,
-  coerceClassifyResult,
-  stripJsonFences,
-  validateClassifierJson,
-} from "@core/classifier/prompt.js";
-export type FetchImpl = typeof fetch;
-// Tried raising 8000 → 28000 on 2026-05-25 to recover the answer-tail of
-// long gold sessions (median LongMemEval-S gold body is 14,294 chars). The
-// Ollama /api/embeddings endpoint returned 500 on 54% of those large
-// inputs despite nomic-embed-text's nominal 8192-token context — semantic
-// R@5 collapsed from 87.2% → 15.8%. Reverted. Real fix is chunk + max-pool
-// (each body split into ≤8K-char chunks, store all vectors, score against
-// max cosine at query time) so coverage doesn't depend on a single embed
-// call. Filed as #174.
-const MAX_EMBED_CHARS = 8_000;
-const EMBED_PREFIXES: Record<EmbeddingKind, string> = {
-  query: "search_query: ",
-  document: "search_document: ",
-};
-export function l2Normalize(vec: Float32Array): Float32Array {
-  let sumSq = 0;
-  for (let i = 0; i < vec.length; i++) {
-    const v = vec[i] ?? 0;
-    sumSq += v * v;
-  }
-  if (sumSq === 0) return vec;
-  const norm = Math.sqrt(sumSq);
-  const out = new Float32Array(vec.length);
-  for (let i = 0; i < vec.length; i++) {
-    out[i] = (vec[i] ?? 0) / norm;
-  }
-  return out;
-}
-export interface OllamaClientOptions {
-  readonly baseUrl?: string;
-  readonly embedModel?: string;
-  readonly classifyModel?: string;
-  readonly timeoutMs?: number;
-  readonly classifyTimeoutMs?: number;
-  /** Inject a fake fetch for tests. Defaults to global fetch. */
-  readonly fetchImpl?: FetchImpl;
-}
-interface EmbeddingsResponse {
-  readonly embedding?: ReadonlyArray<number>;
-}
-interface ChatResponse {
-  readonly message?: { readonly content?: string };
-}
-export class OllamaClient implements LLMClient {
-  private readonly baseUrl: string;
-  private readonly embedModel: string;
-  private readonly classifyModel: string;
-  private readonly timeoutMs: number;
-  private readonly classifyTimeoutMs: number;
-  private readonly fetchImpl: FetchImpl;
-  constructor(opts: OllamaClientOptions = {}) {
-    this.baseUrl = (opts.baseUrl ?? "http://localhost:11434").replace(/\/+$/, "");
-    this.embedModel = opts.embedModel ?? "nomic-embed-text";
-    this.classifyModel = opts.classifyModel ?? "phi4-mini:latest";
-    this.timeoutMs = opts.timeoutMs ?? 10_000;
-    this.classifyTimeoutMs = opts.classifyTimeoutMs ?? 180_000;
-    this.fetchImpl = opts.fetchImpl ?? fetch;
-  }
-  async embed(text: string, kind: EmbeddingKind): Promise<EmbedResult> {
-    // nomic-embed-text v1.5 is an asymmetric retrieval model. The
-    // search_query:/search_document: prefix is part of the training
-    // contract; omitting it or using the wrong one degrades retrieval
-    // quality measurably. MAX_EMBED_CHARS matches the Python ceiling.
-    const truncated = text.slice(0, MAX_EMBED_CHARS);
-    const prompt = `${EMBED_PREFIXES[kind]}${truncated}`;
-    const controller = new AbortController();
-    const timer = setTimeout(() => controller.abort(), this.timeoutMs);
-    try {
-      const res = await this.fetchImpl(`${this.baseUrl}/api/embeddings`, {
-        method: "POST",
-        headers: { "Content-Type": "application/json" },
-        body: JSON.stringify({ model: this.embedModel, prompt }),
-        signal: controller.signal,
-      });
-      if (!res.ok) {
-        throw new LLMUnreachableError("ollama", `status ${res.status}`);
-      }
-      const data = (await res.json()) as EmbeddingsResponse;
-      if (!data.embedding || data.embedding.length === 0) {
-        throw new LLMUnreachableError("ollama", "empty embedding");
-      }
-      const raw = new Float32Array(data.embedding);
-      return { vector: l2Normalize(raw), model: this.embedModel };
-    } catch (e) {
-      if (e instanceof LLMUnreachableError) throw e;
-      throw new LLMUnreachableError("ollama", e);
-    } finally {
-      clearTimeout(timer);
-    }
-  }
-  /**
-   * Send a transcript through the Ollama classifier with the shared system
-   * prompt. Returns a ClassifyResult on success, or throws on network failure
-   * (LLMUnreachableError) or schema-invalid output (Error). The Python
-   * counterpart returned None on parse failure; we throw a typed error so
-   * callers explicitly handle retry / inbox routing rather than swallowing
-   * silent nulls.
-   */
-  async classify(transcript: string, priorContext: string = ""): Promise<ClassifyResult> {
-    const controller = new AbortController();
-    const timer = setTimeout(() => controller.abort(), this.classifyTimeoutMs);
-    try {
-      const userPrompt = buildUserPrompt(transcript, priorContext);
-      const res = await this.fetchImpl(`${this.baseUrl}/api/chat`, {
-        method: "POST",
-        headers: { "Content-Type": "application/json" },
-        body: JSON.stringify({
-          model: this.classifyModel,
-          messages: [
-            { role: "system", content: CLASSIFIER_SYSTEM_PROMPT },
-            { role: "user", content: userPrompt },
-          ],
-          stream: false,
-          format: "json",
-          options: { temperature: 0.1 },
-        }),
-        signal: controller.signal,
-      });
-      if (!res.ok) {
-        throw new LLMUnreachableError("ollama", `status ${res.status}`);
-      }
-      const data = (await res.json()) as ChatResponse;
-      const rawContent = data.message?.content?.trim() ?? "";
-      const content = stripJsonFences(rawContent);
-      let parsed: unknown;
-      try {
-        parsed = JSON.parse(content);
-      } catch {
-        throw new ClassifierSchemaError("ollama returned non-JSON content");
-      }
-      if (!validateClassifierJson(parsed)) {
-        throw new ClassifierSchemaError("ollama response missing required keys");
-      }
-      return coerceClassifyResult(parsed);
-    } catch (e) {
-      if (e instanceof LLMUnreachableError || e instanceof ClassifierSchemaError) throw e;
-      throw new LLMUnreachableError("ollama", e);
-    } finally {
-      clearTimeout(timer);
-    }
-  }
-}
-export class ClassifierSchemaError extends Error {
-  constructor(message: string) {
-    super(message);
-    this.name = "ClassifierSchemaError";
-  }
-}