npm - claude-memory-hub - Versions diffs - 0.5.2 → 0.6.0 - Mend

claude-memory-hub 0.5.2 → 0.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/CHANGELOG.md +80 -0
package/README.md +52 -7
package/dist/cli.js +274 -21
package/dist/hooks/post-compact.js +1013 -34
package/dist/hooks/post-tool-use.js +887 -33
package/dist/hooks/pre-compact.js +1013 -34
package/dist/hooks/session-end.js +1106 -35
package/dist/hooks/user-prompt-submit.js +887 -33
package/dist/index.js +1149 -425
package/package.json +11 -6

package/CHANGELOG.md CHANGED Viewed

@@ -5,6 +5,86 @@ Format follows [Keep a Changelog](https://keepachangelog.com/).
 ---
+## [0.6.0] - 2026-04-01
+Major release: semantic search, resource intelligence, observation capture, CLAUDE.md tracking, LLM summarization.
+### Phase 1 — ResourceRegistry + Entity Coverage
+- **ResourceRegistry** — unified scanner for ALL `.claude` locations: skills (58), agents (36), commands (65), workflows (10), CLAUDE.md. Parses agent frontmatter `name:` for correct resolution (e.g., `ios-developer` → `~/.claude/agent_mobile/ios/AGENT.md`). 3-level token estimation: listing (~50-200), full (200-8000), total (all files on disk)
+- **OverheadReport** — `memory_context_budget` MCP tool now shows: fixed token overhead breakdown, unused skill/agent detection, potential savings recommendations
+- **InjectionValidator** — sanitizes context before `UserPromptSubmit` injection. Strips HTML comments, caps at 4500 chars, filters dead resource recommendations via `filterAliveRecommendations()`
+- **Agent/Skill entities** — `Agent` and `Skill` tool calls now produce `entity_type="decision"` entities (importance 3/2), visible in summarization and compact scoring
+- **Expanded resource types** — `resource_usage` table tracks 8 types: skill, agent, command, workflow, claude_md, memory, mcp_tool, hook (was 5)
+- **Real token costs** — `SmartResourceLoader` uses ResourceRegistry for actual file-size-based estimates instead of hardcoded 500 fallback
+### Phase 2 — Schema v3 + Observations + CLAUDE.md Tracking
+- **Schema migration v3** — entities table rebuilt with `observation` type in CHECK constraint + new `claude_md_registry` table
+- **Observation extractor** — heuristic-based free-form capture from tool output and user prompts. Keywords: IMPORTANT/CRITICAL (importance 4), decision:/NOTE: (3), TODO:/FIXME: (2). Max 1 observation per tool call, capped at 300 chars
+- **CLAUDE.md tracker** — walks from `cwd` to root, finds all CLAUDE.md files, extracts `## sections` + 200-char previews, content-hash change detection (only re-parses on change), injects rule summary into context
+- **Session summarizer** includes top 5 observations in L3 summaries
+- **Vector search** reindexes observation entities alongside decisions and errors
+### Phase 3 — LLM Summarization Pipeline
+- **3-tier fallback** — Tier 1: PostCompact summary (free, already existed). Tier 2: `claude -p ... --print` subprocess with 30s timeout. Tier 3: Rule-based (always available)
+- **Hook recursion guard** — `CLAUDE_MEMORY_HUB_SKIP_HOOKS=1` env var set on CLI subprocess, checked by all 5 hook entry scripts. Prevents infinite loop when CLI summarizer triggers hooks
+- **Configurable** — `CLAUDE_MEMORY_HUB_LLM=auto|cli-only|rule-based` env var. `CLAUDE_MEMORY_HUB_LLM_TIMEOUT_MS` for custom timeout
+### Phase 4 — Semantic Search
+- **Embedding model** — `@huggingface/transformers` with `all-MiniLM-L6-v2` (384-dim, 90MB cached, 9ms warm inference). Lazy-loaded: only imports when first embedding requested. Graceful degradation if package not installed
+- **Pure JS cosine similarity** — no native sqlite-vec binary needed. Fast enough for <1000 docs. Embeddings stored as BLOBs in new `embeddings` table (schema v4)
+- **Hybrid search** — `searchIndex()` now merges FTS5 BM25 + TF-IDF + semantic cosine similarity. Deduplicates by id+type, keeps highest score
+- **Auto-indexing** — session-end hook generates embedding for new summaries automatically
+- **Opt-in** — `CLAUDE_MEMORY_HUB_EMBEDDINGS=auto|disabled` env var. `@huggingface/transformers` is `optionalDependencies` — install failure doesn't break anything
+### New Environment Variables
+| Variable | Default | Description |
+|----------|---------|-------------|
+| `CLAUDE_MEMORY_HUB_LLM` | `auto` | Summarization mode: auto, cli-only, rule-based |
+| `CLAUDE_MEMORY_HUB_LLM_TIMEOUT_MS` | `30000` | CLI summarizer timeout in ms |
+| `CLAUDE_MEMORY_HUB_EMBEDDINGS` | `auto` | Embedding mode: auto, disabled |
+| `CLAUDE_MEMORY_HUB_SKIP_HOOKS` | — | Set to `1` to suppress hooks (internal use) |
+### New/Modified Files
+```
+NEW:
+  src/context/resource-registry.ts      — unified resource scanner
+  src/context/injection-validator.ts    — context sanitization
+  src/capture/observation-extractor.ts  — free-form observation capture
+  src/context/claude-md-tracker.ts      — CLAUDE.md scanning + tracking
+  src/summarizer/cli-summarizer.ts      — Tier 2 CLI summarization
+  src/search/embedding-model.ts         — lazy @huggingface/transformers
+  src/search/semantic-search.ts         — cosine similarity search
+MODIFIED:
+  src/db/schema.ts                      — migrations v3 + v4
+  src/types/index.ts                    — EntityType += observation
+  src/capture/entity-extractor.ts       — Agent/Skill + observation extraction
+  src/capture/hook-handler.ts           — registry + validator + CLAUDE.md + observations
+  src/context/smart-resource-loader.ts  — uses ResourceRegistry
+  src/context/resource-tracker.ts       — 8 resource types
+  src/mcp/tool-handlers.ts             — overhead report in context_budget
+  src/summarizer/session-summarizer.ts  — 3-tier pipeline
+  src/search/search-workflow.ts         — hybrid FTS5+TF-IDF+semantic
+  src/search/vector-search.ts           — reindex includes observations+embeddings
+  src/db/session-store.ts               — getSessionObservations()
+  src/hooks-entry/*.ts                  — SKIP_HOOKS recursion guard
+```
+### Dependencies
+```
+KEPT:     @modelcontextprotocol/sdk
+ADDED:    @huggingface/transformers (optional — semantic search)
+```
+---
 ## [0.5.2] - 2026-04-01
 ### Fixed

package/README.md CHANGED Viewed

@@ -45,8 +45,13 @@ Search:        Keyword-only, no semantic ranking
 | Influence what compact preserves | -- | -- | **Yes** |
 | Save compact output | -- | -- | **Yes** |
 | Token budget optimization | -- | -- | **Yes** |
-| Hybrid search (FTS5 + TF-IDF) | -- | Partial | **Yes** |
+| Semantic search (embeddings) | -- | Chroma (external) | **Yes (offline)** |
+| Hybrid search (FTS5 + TF-IDF + semantic) | -- | Partial | **Yes** |
 | 3-layer progressive search | -- | Yes | **Yes** |
+| Resource overhead analysis | -- | -- | **Yes** |
+| CLAUDE.md rule tracking | -- | -- | **Yes** |
+| Free-form observation capture | -- | Yes | **Yes** |
+| LLM summarization (3-tier) | -- | Yes (API) | **Yes (free)** |
 | Browser UI | -- | Yes | **Yes** |
 | Health monitoring | -- | -- | **Yes** |
 | Migrate from claude-mem | N/A | N/A | **Yes** |
@@ -127,7 +132,7 @@ Session N+1     → UserPromptSubmit hook fires
 memory-hub tracks which skills/agents/tools you **actually use**, then recommends only those for future sessions. Rare resources load on demand via SkillTool.
-### Layer 5 — 3-Layer Progressive Search (new in v0.5)
+### Layer 5 — 3-Layer Progressive Search + Semantic (new in v0.5/v0.6)
 ```
 Traditional search: query → ALL full records → 5000+ tokens wasted
@@ -140,7 +145,35 @@ memory-hub search:  query → Layer 1 (index)    → ~50 tokens/result
                     Token savings: ~80-90% vs. full context
 ```
-Hybrid ranking: FTS5 BM25 for keyword matches + TF-IDF cosine similarity for semantic ranking. Zero external dependencies — pure TypeScript implementation.
+Hybrid ranking: FTS5 BM25 (keyword) + TF-IDF (term frequency) + **semantic cosine similarity** (384-dim embeddings, v0.6). "debugging tips" now matches "error fixing" even without shared keywords.
+### Layer 6 — Resource Intelligence (new in v0.6)
+```
+ResourceRegistry scans ALL .claude locations:
+  ~/.claude/skills/          58 skills → listing + full + total tokens
+  ~/.claude/agents/          36 agents → frontmatter name: resolution
+  ~/.claude/agent_mobile/    ios-developer → agent_mobile/ios/AGENT.md
+  ~/.claude/commands/        65 commands → relative path naming
+  ~/.claude/workflows/       10 workflows
+  ~/.claude/CLAUDE.md        + project CLAUDE.md chain
+OverheadReport:
+  "56/64 skills unused in last 10 sessions → ~1033 listing tokens wasted"
+  "CLAUDE.md chain is 3222 tokens"
+```
+### Layer 7 — Observation Capture (new in v0.6)
+```
+Tool output contains "IMPORTANT: always pool DB connections"
+  → observation entity (importance=4) saved to L2
+  → included in session summary
+  → searchable across sessions
+User prompt contains "remember that we use TypeScript strict"
+  → observation entity (importance=3) saved to L2
+```
 ---
@@ -195,6 +228,9 @@ Hybrid ranking: FTS5 BM25 for keyword matches + TF-IDF cosine similarity for sem
                    │   resource_usage   │
                    │   fts_memories     │
                    │   tfidf_index      │
+                   │   embeddings       │
+                   │   claude_md_       │
+                   │    registry        │
                    │   health_checks    │
                    └────────────────────┘
 ```
@@ -361,6 +397,7 @@ Migration is idempotent — safe to run multiple times with zero duplicates.
 | **v0.3.0** | Removed API key requirement, 1-command install |
 | **v0.4.0** | Smart resource loading, token budget optimization |
 | **v0.5.0** | Production hardening, hybrid search, 3-layer progressive search, browser UI, health monitoring, claude-mem migration |
+| **v0.6.0** | ResourceRegistry (170 resources), semantic search (384-dim embeddings), observation capture, CLAUDE.md tracking, 3-tier LLM summarization, overhead analysis |
 See [CHANGELOG.md](CHANGELOG.md) for full details.
@@ -369,13 +406,21 @@ See [CHANGELOG.md](CHANGELOG.md) for full details.
 ## Dependencies
 ```
-@modelcontextprotocol/sdk    MCP stdio server
-bun:sqlite                   Built-in, zero install
+@modelcontextprotocol/sdk          MCP stdio server (required)
+bun:sqlite                         Built-in, zero install
+@huggingface/transformers          Semantic search embeddings (optional)
 ```
-That's it. **One npm package.** The other is built into Bun.
+**Two npm packages + one optional.** No Python. No Chroma. No HTTP server. No API key. No Docker.
+### Environment Variables
-No Python. No Chroma. No HTTP server. No API key. No Docker.
+| Variable | Default | Description |
+|----------|---------|-------------|
+| `CLAUDE_MEMORY_HUB_LLM` | `auto` | Summarization: auto, cli-only, rule-based |
+| `CLAUDE_MEMORY_HUB_LLM_TIMEOUT_MS` | `30000` | CLI summarizer timeout |
+| `CLAUDE_MEMORY_HUB_EMBEDDINGS` | `auto` | Embeddings: auto, disabled |
+| `CMH_LOG_LEVEL` | `info` | Log level: debug, info, warn, error |
 ---

package/dist/cli.js CHANGED Viewed

@@ -1,9 +1,22 @@
 #!/usr/bin/env bun
 // @bun
+var __create = Object.create;
+var __getProtoOf = Object.getPrototypeOf;
 var __defProp = Object.defineProperty;
 var __getOwnPropNames = Object.getOwnPropertyNames;
 var __getOwnPropDesc = Object.getOwnPropertyDescriptor;
 var __hasOwnProp = Object.prototype.hasOwnProperty;
+var __toESM = (mod, isNodeMode, target) => {
+  target = mod != null ? __create(__getProtoOf(mod)) : {};
+  const to = isNodeMode || !mod || !mod.__esModule ? __defProp(target, "default", { value: mod, enumerable: true }) : target;
+  for (let key of __getOwnPropNames(mod))
+    if (!__hasOwnProp.call(to, key))
+      __defProp(to, key, {
+        get: () => mod[key],
+        enumerable: true
+      });
+  return to;
+};
 var __moduleCache = /* @__PURE__ */ new WeakMap;
 var __toCommonJS = (from) => {
   var entry = __moduleCache.get(from), desc;
@@ -158,6 +171,68 @@ function applyMigrations(db) {
     db.run("INSERT OR IGNORE INTO schema_versions(version, applied_at) VALUES (2, ?)", [Date.now()]);
     log.info("Migration v2 complete");
   }
+  if (currentVersion < 3) {
+    log.info("Applying migration v3: observation entity type + claude_md_registry");
+    db.transaction(() => {
+      db.run(`
+        CREATE TABLE entities_v3 (
+          id            INTEGER PRIMARY KEY AUTOINCREMENT,
+          session_id    TEXT NOT NULL REFERENCES sessions(id) ON DELETE CASCADE,
+          project       TEXT NOT NULL,
+          tool_name     TEXT NOT NULL,
+          entity_type   TEXT NOT NULL
+            CHECK(entity_type IN ('file_read','file_modified','file_created','error','decision','observation')),
+          entity_value  TEXT NOT NULL,
+          context       TEXT,
+          importance    INTEGER NOT NULL DEFAULT 1
+            CHECK(importance BETWEEN 1 AND 5),
+          created_at    INTEGER NOT NULL,
+          prompt_number INTEGER NOT NULL DEFAULT 0,
+          discovery_tokens INTEGER NOT NULL DEFAULT 0
+        )
+      `);
+      db.run(`INSERT INTO entities_v3 SELECT * FROM entities`);
+      db.run(`DROP TABLE entities`);
+      db.run(`ALTER TABLE entities_v3 RENAME TO entities`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_entities_session ON entities(session_id)`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_entities_project ON entities(project)`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_entities_type    ON entities(entity_type)`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_entities_value   ON entities(entity_value)`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_entities_created ON entities(created_at DESC)`);
+      db.run(`
+        CREATE TABLE IF NOT EXISTS claude_md_registry (
+          id            INTEGER PRIMARY KEY AUTOINCREMENT,
+          path          TEXT NOT NULL UNIQUE,
+          project       TEXT NOT NULL,
+          content_hash  TEXT NOT NULL,
+          sections_json TEXT NOT NULL DEFAULT '[]',
+          last_seen     INTEGER NOT NULL,
+          token_cost    INTEGER NOT NULL DEFAULT 0
+        )
+      `);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_cmr_project ON claude_md_registry(project)`);
+      db.run(`CREATE INDEX IF NOT EXISTS idx_cmr_path    ON claude_md_registry(path)`);
+    })();
+    db.run("INSERT OR IGNORE INTO schema_versions(version, applied_at) VALUES (3, ?)", [Date.now()]);
+    log.info("Migration v3 complete");
+  }
+  if (currentVersion < 4) {
+    log.info("Applying migration v4: embeddings table for semantic search");
+    db.run(`
+      CREATE TABLE IF NOT EXISTS embeddings (
+        id         INTEGER PRIMARY KEY AUTOINCREMENT,
+        doc_type   TEXT NOT NULL CHECK(doc_type IN ('summary','entity','note')),
+        doc_id     INTEGER NOT NULL,
+        model      TEXT NOT NULL DEFAULT 'all-MiniLM-L6-v2',
+        vector     BLOB NOT NULL,
+        created_at INTEGER NOT NULL
+      )
+    `);
+    db.run(`CREATE UNIQUE INDEX IF NOT EXISTS idx_embeddings_doc ON embeddings(doc_type, doc_id)`);
+    db.run(`CREATE INDEX IF NOT EXISTS idx_embeddings_model ON embeddings(model)`);
+    db.run("INSERT OR IGNORE INTO schema_versions(version, applied_at) VALUES (4, ?)", [Date.now()]);
+    log.info("Migration v4 complete");
+  }
 }
 function getDatabase() {
   if (!_db) {
@@ -453,6 +528,155 @@ var init_monitor = __esm(() => {
   log2 = createLogger("health");
 });
+// src/search/embedding-model.ts
+class EmbeddingModel {
+  pipeline = null;
+  loading = null;
+  available = true;
+  async embed(text) {
+    if (!this.available)
+      return null;
+    await this.ensureLoaded();
+    if (!this.pipeline)
+      return null;
+    try {
+      const result = await this.pipeline(text, { pooling: "mean", normalize: true });
+      return new Float32Array(result.data);
+    } catch (err) {
+      log3.error("embed failed", { error: String(err) });
+      return null;
+    }
+  }
+  async embedBatch(texts) {
+    if (!this.available || texts.length === 0)
+      return texts.map(() => null);
+    await this.ensureLoaded();
+    if (!this.pipeline)
+      return texts.map(() => null);
+    const results = [];
+    for (const text of texts) {
+      try {
+        const result = await this.pipeline(text, { pooling: "mean", normalize: true });
+        results.push(new Float32Array(result.data));
+      } catch {
+        results.push(null);
+      }
+    }
+    return results;
+  }
+  get isAvailable() {
+    return this.available && this.pipeline !== null;
+  }
+  get isLoadAttempted() {
+    return this.loading !== null;
+  }
+  async ensureLoaded() {
+    if (this.pipeline || !this.available)
+      return;
+    if (!this.loading)
+      this.loading = this.loadModel();
+    await this.loading;
+  }
+  async loadModel() {
+    if (process.env["CLAUDE_MEMORY_HUB_EMBEDDINGS"] === "disabled") {
+      this.available = false;
+      return;
+    }
+    try {
+      const { pipeline, env } = await import("@huggingface/transformers");
+      env.allowLocalModels = true;
+      env.allowRemoteModels = true;
+      const t0 = Date.now();
+      this.pipeline = await pipeline("feature-extraction", MODEL_NAME, { dtype: "fp32" });
+      log3.info("Embedding model loaded", { model: MODEL_NAME, ms: Date.now() - t0 });
+    } catch (err) {
+      log3.warn("Embedding model unavailable", { error: String(err) });
+      this.available = false;
+    }
+  }
+}
+var log3, MODEL_NAME = "Xenova/all-MiniLM-L6-v2", EMBEDDING_DIM = 384, embeddingModel;
+var init_embedding_model = __esm(() => {
+  init_logger();
+  log3 = createLogger("embedding-model");
+  embeddingModel = new EmbeddingModel;
+});
+// src/search/semantic-search.ts
+var exports_semantic_search = {};
+__export(exports_semantic_search, {
+  semanticSearch: () => semanticSearch,
+  reindexAllEmbeddings: () => reindexAllEmbeddings,
+  indexEmbedding: () => indexEmbedding
+});
+async function indexEmbedding(docType, docId, text, db) {
+  const vector = await embeddingModel.embed(text);
+  if (!vector)
+    return;
+  const d = db ?? getDatabase();
+  const blob = Buffer.from(vector.buffer);
+  d.run(`INSERT INTO embeddings(doc_type, doc_id, model, vector, created_at)
+     VALUES (?, ?, 'all-MiniLM-L6-v2', ?, ?)
+     ON CONFLICT(doc_type, doc_id) DO UPDATE SET
+       vector = excluded.vector,
+       created_at = excluded.created_at`, [docType, docId, blob, Date.now()]);
+}
+async function semanticSearch(query, limit = 10, db) {
+  const queryVec = await embeddingModel.embed(query);
+  if (!queryVec)
+    return [];
+  const d = db ?? getDatabase();
+  const rows = d.query("SELECT doc_type, doc_id, vector FROM embeddings").all();
+  if (rows.length === 0)
+    return [];
+  const scored = [];
+  for (const row of rows) {
+    const docVec = new Float32Array(row.vector.buffer, row.vector.byteOffset, EMBEDDING_DIM);
+    const score = cosineSimilarity(queryVec, docVec);
+    if (score > 0.2) {
+      scored.push({ doc_type: row.doc_type, doc_id: row.doc_id, score });
+    }
+  }
+  scored.sort((a, b) => b.score - a.score);
+  return scored.slice(0, limit);
+}
+async function reindexAllEmbeddings(db) {
+  if (!embeddingModel.isAvailable && embeddingModel.isLoadAttempted)
+    return;
+  const d = db ?? getDatabase();
+  log4.info("Starting embedding reindex...");
+  const summaries = d.query("SELECT id, summary, files_touched, decisions FROM long_term_summaries").all();
+  let indexed = 0;
+  for (const s of summaries) {
+    const text = [s.summary, s.files_touched, s.decisions].join(" ");
+    await indexEmbedding("summary", s.id, text, d);
+    indexed++;
+    if (indexed % 50 === 0)
+      log4.info("Embedding reindex progress", { indexed, total: summaries.length });
+  }
+  const entities = d.query("SELECT id, entity_value, context FROM entities WHERE entity_type IN ('decision', 'error', 'observation')").all();
+  for (const e of entities) {
+    const text = [e.entity_value, e.context || ""].join(" ");
+    await indexEmbedding("entity", e.id, text, d);
+    indexed++;
+  }
+  log4.info("Embedding reindex complete", { summaries: summaries.length, entities: entities.length });
+}
+function cosineSimilarity(a, b) {
+  let dot = 0;
+  for (let i = 0;i < a.length; i++) {
+    dot += a[i] * b[i];
+  }
+  return dot;
+}
+var log4;
+var init_semantic_search = __esm(() => {
+  init_schema();
+  init_embedding_model();
+  init_logger();
+  log4 = createLogger("semantic-search");
+});
 // src/search/vector-search.ts
 var exports_vector_search = {};
 __export(exports_vector_search, {
@@ -501,9 +725,9 @@ function rebuildIDF(db) {
         WHERE t2.term = tfidf_index.term
       )
     `, [totalDocs]);
-    log3.info("IDF rebuilt", { totalDocs });
+    log5.info("IDF rebuilt", { totalDocs });
   } catch (e) {
-    log3.error("IDF rebuild failed", { error: String(e) });
+    log5.error("IDF rebuild failed", { error: String(e) });
   }
 }
 function vectorSearch(query, limit = 10, docTypeFilter, db) {
@@ -526,31 +750,32 @@ function vectorSearch(query, limit = 10, docTypeFilter, db) {
     `).all(...queryTokens, limit);
     return results;
   } catch (e) {
-    log3.error("Vector search failed", { error: String(e) });
+    log5.error("Vector search failed", { error: String(e) });
     return [];
   }
 }
 function reindexAll(db) {
   const d = db ?? getDatabase();
-  log3.info("Starting full reindex...");
+  log5.info("Starting full reindex...");
   const summaries = d.query("SELECT id, summary, files_touched, decisions FROM long_term_summaries").all();
   for (const s of summaries) {
     const text = [s.summary, s.files_touched, s.decisions].join(" ");
     indexDocument("summary", s.id, text, d);
   }
-  const entities = d.query("SELECT id, entity_value, context FROM entities WHERE entity_type IN ('decision', 'error')").all();
+  const entities = d.query("SELECT id, entity_value, context FROM entities WHERE entity_type IN ('decision', 'error', 'observation')").all();
   for (const e of entities) {
     const text = [e.entity_value, e.context || ""].join(" ");
     indexDocument("entity", e.id, text, d);
   }
   rebuildIDF(d);
-  log3.info("Full reindex complete", { summaries: summaries.length, entities: entities.length });
+  Promise.resolve().then(() => (init_semantic_search(), exports_semantic_search)).then(({ reindexAllEmbeddings: reindexAllEmbeddings2 }) => reindexAllEmbeddings2(d)).catch(() => {});
+  log5.info("Full reindex complete", { summaries: summaries.length, entities: entities.length });
 }
-var log3, STOP_WORDS;
+var log5, STOP_WORDS;
 var init_vector_search = __esm(() => {
   init_schema();
   init_logger();
-  log3 = createLogger("vector-search");
+  log5 = createLogger("vector-search");
   STOP_WORDS = new Set([
     "the",
     "a",
@@ -665,7 +890,7 @@ var init_vector_search = __esm(() => {
 });
 // src/search/search-workflow.ts
-function searchIndex(query, opts = {}, db) {
+async function searchIndex(query, opts = {}, db) {
   const d = db ?? getDatabase();
   const limit = opts.limit ?? 20;
   const offset = opts.offset ?? 0;
@@ -707,9 +932,36 @@ function searchIndex(query, opts = {}, db) {
       }
     }
   }
+  try {
+    const semResults = await semanticSearch(query, limit, d);
+    for (const sr of semResults) {
+      const key = `${sr.doc_type}:${sr.doc_id}`;
+      if (results.some((r) => `${r.type}:${r.id}` === key))
+        continue;
+      if (sr.doc_type === "summary") {
+        const row = d.prepare("SELECT id, project, SUBSTR(summary, 1, 80) as summary, created_at FROM long_term_summaries WHERE id = ?").get(sr.doc_id);
+        if (row) {
+          results.push({ id: row.id, type: "summary", title: row.summary, project: row.project, created_at: row.created_at, score: sr.score });
+        }
+      } else if (sr.doc_type === "entity") {
+        const row = d.prepare("SELECT id, project, SUBSTR(entity_value, 1, 80) as entity_value, created_at FROM entities WHERE id = ?").get(sr.doc_id);
+        if (row) {
+          results.push({ id: row.id, type: "entity", title: row.entity_value, project: row.project, created_at: row.created_at, score: sr.score });
+        }
+      }
+    }
+  } catch {}
   const filtered = opts.project ? results.filter((r) => r.project === opts.project) : results;
-  filtered.sort((a, b) => b.score - a.score);
-  return filtered.slice(0, limit);
+  const deduped = new Map;
+  for (const r of filtered) {
+    const key = `${r.type}:${r.id}`;
+    const existing = deduped.get(key);
+    if (!existing || r.score > existing.score)
+      deduped.set(key, r);
+  }
+  const merged = [...deduped.values()];
+  merged.sort((a, b) => b.score - a.score);
+  return merged.slice(0, limit);
 }
 function sanitizeFtsQuery(query) {
   const words = query.trim().split(/\s+/).filter(Boolean).map((w) => w.replace(/["*^():{}[\]]/g, "").trim()).filter((w) => w.length > 1);
@@ -721,12 +973,13 @@ function sanitizeFtsQuery(query) {
   const last = words[words.length - 1];
   return [...head, `"${last}"*`].join(" ");
 }
-var log4;
+var log6;
 var init_search_workflow = __esm(() => {
   init_schema();
   init_vector_search();
+  init_semantic_search();
   init_logger();
-  log4 = createLogger("search-workflow");
+  log6 = createLogger("search-workflow");
 });
 // src/ui/viewer.ts
@@ -734,7 +987,7 @@ var exports_viewer = {};
 __export(exports_viewer, {
   startViewer: () => startViewer
 });
-function handleApi(url) {
+async function handleApi(url) {
   const db = getDatabase();
   const path = url.pathname;
   try {
@@ -753,7 +1006,7 @@ function handleApi(url) {
       const limit = parseInt(url.searchParams.get("limit") || "20");
       const offset = parseInt(url.searchParams.get("offset") || "0");
       const project = url.searchParams.get("project");
-      return json(searchIndex(query, { limit, offset, ...project ? { project } : {} }, db));
+      return json(await searchIndex(query, { limit, offset, ...project ? { project } : {} }, db));
     }
     if (path === "/api/sessions") {
       const limit = parseInt(url.searchParams.get("limit") || "50");
@@ -780,7 +1033,7 @@ function handleApi(url) {
     }
     return json({ error: "Not found" }, 404);
   } catch (e) {
-    log5.error("API error", { path, error: String(e) });
+    log7.error("API error", { path, error: String(e) });
     return json({ error: String(e) }, 500);
   }
 }
@@ -800,7 +1053,7 @@ function startViewer() {
           return handleApi(url);
         return new Response(HTML, { headers: { "Content-Type": "text/html" } });
       } catch (e) {
-        log5.error("Server fetch error", { error: String(e) });
+        log7.error("Server fetch error", { error: String(e) });
         return new Response(JSON.stringify({ error: String(e) }), {
           status: 500,
           headers: { "Content-Type": "application/json" }
@@ -808,7 +1061,7 @@ function startViewer() {
       }
     },
     error(err) {
-      log5.error("Server error", { error: String(err) });
+      log7.error("Server error", { error: String(err) });
       return new Response(JSON.stringify({ error: String(err) }), {
         status: 500,
         headers: { "Content-Type": "application/json" }
@@ -816,9 +1069,9 @@ function startViewer() {
     }
   });
   console.log(`claude-memory-hub viewer running at http://localhost:${server.port}`);
-  log5.info("Viewer started", { port: server.port });
+  log7.info("Viewer started", { port: server.port });
 }
-var log5, PORT = 37888, HTML = `<!DOCTYPE html>
+var log7, PORT = 37888, HTML = `<!DOCTYPE html>
 <html lang="en">
 <head>
 <meta charset="utf-8">
@@ -1078,7 +1331,7 @@ var init_viewer = __esm(() => {
   init_logger();
   init_monitor();
   init_search_workflow();
-  log5 = createLogger("viewer");
+  log7 = createLogger("viewer");
 });
 // src/cli/main.ts