npm - @phren/cli - Versions diffs - 0.0.1 - Mend

@phren/cli 0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (185) hide show

package/LICENSE +21 -0
package/README.md +590 -0
package/mcp/dist/capabilities/cli.js +61 -0
package/mcp/dist/capabilities/index.js +15 -0
package/mcp/dist/capabilities/mcp.js +61 -0
package/mcp/dist/capabilities/types.js +57 -0
package/mcp/dist/capabilities/vscode.js +61 -0
package/mcp/dist/capabilities/web-ui.js +61 -0
package/mcp/dist/cli-actions.js +302 -0
package/mcp/dist/cli-config.js +580 -0
package/mcp/dist/cli-extract.js +305 -0
package/mcp/dist/cli-govern.js +371 -0
package/mcp/dist/cli-graph.js +169 -0
package/mcp/dist/cli-hooks-citations.js +44 -0
package/mcp/dist/cli-hooks-context.js +56 -0
package/mcp/dist/cli-hooks-globs.js +83 -0
package/mcp/dist/cli-hooks-output.js +130 -0
package/mcp/dist/cli-hooks-retrieval.js +2 -0
package/mcp/dist/cli-hooks-session.js +1402 -0
package/mcp/dist/cli-hooks.js +350 -0
package/mcp/dist/cli-namespaces.js +989 -0
package/mcp/dist/cli-ops.js +253 -0
package/mcp/dist/cli-search.js +407 -0
package/mcp/dist/cli.js +108 -0
package/mcp/dist/content-archive.js +278 -0
package/mcp/dist/content-citation.js +391 -0
package/mcp/dist/content-dedup.js +622 -0
package/mcp/dist/content-learning.js +472 -0
package/mcp/dist/content-metadata.js +186 -0
package/mcp/dist/content-validate.js +462 -0
package/mcp/dist/core-finding.js +54 -0
package/mcp/dist/core-project.js +36 -0
package/mcp/dist/core-search.js +50 -0
package/mcp/dist/data-access.js +400 -0
package/mcp/dist/data-tasks.js +821 -0
package/mcp/dist/embedding.js +344 -0
package/mcp/dist/entrypoint.js +387 -0
package/mcp/dist/finding-context.js +172 -0
package/mcp/dist/finding-impact.js +181 -0
package/mcp/dist/finding-journal.js +122 -0
package/mcp/dist/finding-lifecycle.js +259 -0
package/mcp/dist/governance-audit.js +22 -0
package/mcp/dist/governance-locks.js +96 -0
package/mcp/dist/governance-policy.js +648 -0
package/mcp/dist/governance-scores.js +355 -0
package/mcp/dist/hooks.js +449 -0
package/mcp/dist/impact-scoring.js +22 -0
package/mcp/dist/index-query.js +168 -0
package/mcp/dist/index.js +205 -0
package/mcp/dist/init-config.js +336 -0
package/mcp/dist/init-preferences.js +62 -0
package/mcp/dist/init-setup.js +1305 -0
package/mcp/dist/init-shared.js +29 -0
package/mcp/dist/init.js +1730 -0
package/mcp/dist/link-checksums.js +62 -0
package/mcp/dist/link-context.js +257 -0
package/mcp/dist/link-doctor.js +591 -0
package/mcp/dist/link-skills.js +212 -0
package/mcp/dist/link.js +596 -0
package/mcp/dist/logger.js +15 -0
package/mcp/dist/machine-identity.js +38 -0
package/mcp/dist/mcp-config.js +254 -0
package/mcp/dist/mcp-data.js +315 -0
package/mcp/dist/mcp-extract-facts.js +78 -0
package/mcp/dist/mcp-extract.js +133 -0
package/mcp/dist/mcp-finding.js +557 -0
package/mcp/dist/mcp-graph.js +339 -0
package/mcp/dist/mcp-hooks.js +256 -0
package/mcp/dist/mcp-memory.js +58 -0
package/mcp/dist/mcp-ops.js +328 -0
package/mcp/dist/mcp-search.js +628 -0
package/mcp/dist/mcp-session.js +651 -0
package/mcp/dist/mcp-skills.js +189 -0
package/mcp/dist/mcp-tasks.js +551 -0
package/mcp/dist/mcp-types.js +7 -0
package/mcp/dist/memory-ui-assets.js +6 -0
package/mcp/dist/memory-ui-data.js +513 -0
package/mcp/dist/memory-ui-graph.js +1910 -0
package/mcp/dist/memory-ui-page.js +353 -0
package/mcp/dist/memory-ui-scripts.js +1387 -0
package/mcp/dist/memory-ui-server.js +1218 -0
package/mcp/dist/memory-ui-styles.js +555 -0
package/mcp/dist/memory-ui.js +9 -0
package/mcp/dist/package-metadata.js +13 -0
package/mcp/dist/phren-art.js +52 -0
package/mcp/dist/phren-core.js +108 -0
package/mcp/dist/phren-dotenv.js +67 -0
package/mcp/dist/phren-paths.js +476 -0
package/mcp/dist/proactivity.js +172 -0
package/mcp/dist/profile-store.js +228 -0
package/mcp/dist/project-config.js +85 -0
package/mcp/dist/project-locator.js +25 -0
package/mcp/dist/project-topics.js +1134 -0
package/mcp/dist/provider-adapters.js +176 -0
package/mcp/dist/runtime-profile.js +18 -0
package/mcp/dist/session-checkpoints.js +131 -0
package/mcp/dist/session-utils.js +68 -0
package/mcp/dist/shared-content.js +8 -0
package/mcp/dist/shared-embedding-cache.js +143 -0
package/mcp/dist/shared-fragment-graph.js +456 -0
package/mcp/dist/shared-governance.js +4 -0
package/mcp/dist/shared-index.js +1334 -0
package/mcp/dist/shared-ollama.js +192 -0
package/mcp/dist/shared-paths.js +1 -0
package/mcp/dist/shared-retrieval.js +796 -0
package/mcp/dist/shared-search-fallback.js +375 -0
package/mcp/dist/shared-sqljs.js +42 -0
package/mcp/dist/shared-stemmer.js +171 -0
package/mcp/dist/shared-vector-index.js +199 -0
package/mcp/dist/shared.js +114 -0
package/mcp/dist/shell-entry.js +209 -0
package/mcp/dist/shell-input.js +943 -0
package/mcp/dist/shell-palette.js +119 -0
package/mcp/dist/shell-render.js +252 -0
package/mcp/dist/shell-state-store.js +81 -0
package/mcp/dist/shell-types.js +13 -0
package/mcp/dist/shell-view-list.js +14 -0
package/mcp/dist/shell-view.js +707 -0
package/mcp/dist/shell.js +352 -0
package/mcp/dist/skill-files.js +117 -0
package/mcp/dist/skill-registry.js +279 -0
package/mcp/dist/skill-state.js +28 -0
package/mcp/dist/startup-embedding.js +57 -0
package/mcp/dist/status.js +323 -0
package/mcp/dist/synonyms.json +670 -0
package/mcp/dist/task-hygiene.js +251 -0
package/mcp/dist/task-lifecycle.js +347 -0
package/mcp/dist/tasks-github.js +76 -0
package/mcp/dist/telemetry.js +165 -0
package/mcp/dist/test-global-setup.js +37 -0
package/mcp/dist/tool-registry.js +104 -0
package/mcp/dist/update.js +97 -0
package/mcp/dist/utils.js +543 -0
package/package.json +67 -0
package/skills/README.md +7 -0
package/skills/consolidate/SKILL.md +152 -0
package/skills/discover/SKILL.md +175 -0
package/skills/init/SKILL.md +216 -0
package/skills/profiles/SKILL.md +121 -0
package/skills/sync/SKILL.md +261 -0
package/starter/README.md +74 -0
package/starter/global/CLAUDE.md +89 -0
package/starter/global/skills/humanize.md +30 -0
package/starter/global/skills/pipeline.md +35 -0
package/starter/global/skills/release.md +35 -0
package/starter/machines.yaml +8 -0
package/starter/my-api/.claude/skills/README.md +7 -0
package/starter/my-api/CLAUDE.md +33 -0
package/starter/my-api/FINDINGS.md +9 -0
package/starter/my-api/summary.md +7 -0
package/starter/my-api/tasks.md +7 -0
package/starter/my-first-project/.claude/skills/README.md +7 -0
package/starter/my-first-project/CLAUDE.md +49 -0
package/starter/my-first-project/FINDINGS.md +24 -0
package/starter/my-first-project/summary.md +11 -0
package/starter/my-first-project/tasks.md +25 -0
package/starter/my-frontend/.claude/skills/README.md +7 -0
package/starter/my-frontend/CLAUDE.md +33 -0
package/starter/my-frontend/FINDINGS.md +9 -0
package/starter/my-frontend/summary.md +7 -0
package/starter/my-frontend/tasks.md +7 -0
package/starter/profiles/default.yaml +4 -0
package/starter/profiles/personal.yaml +4 -0
package/starter/profiles/work.yaml +4 -0
package/starter/templates/README.md +7 -0
package/starter/templates/frontend/CLAUDE.md +23 -0
package/starter/templates/frontend/FINDINGS.md +7 -0
package/starter/templates/frontend/reference/README.md +4 -0
package/starter/templates/frontend/summary.md +7 -0
package/starter/templates/frontend/tasks.md +11 -0
package/starter/templates/library/CLAUDE.md +22 -0
package/starter/templates/library/FINDINGS.md +7 -0
package/starter/templates/library/reference/README.md +4 -0
package/starter/templates/library/summary.md +7 -0
package/starter/templates/library/tasks.md +11 -0
package/starter/templates/monorepo/CLAUDE.md +21 -0
package/starter/templates/monorepo/FINDINGS.md +7 -0
package/starter/templates/monorepo/reference/README.md +4 -0
package/starter/templates/monorepo/summary.md +7 -0
package/starter/templates/monorepo/tasks.md +11 -0
package/starter/templates/python-project/CLAUDE.md +21 -0
package/starter/templates/python-project/FINDINGS.md +7 -0
package/starter/templates/python-project/reference/README.md +4 -0
package/starter/templates/python-project/summary.md +7 -0
package/starter/templates/python-project/tasks.md +10 -0

package/mcp/dist/content-dedup.js ADDED Viewed

@@ -0,0 +1,622 @@
+import * as fs from "fs";
+import * as path from "path";
+import * as crypto from "crypto";
+import { debugLog, runtimeFile, KNOWN_OBSERVATION_TAGS } from "./shared.js";
+import { isFeatureEnabled, safeProjectPath } from "./utils.js";
+import { UNIVERSAL_TECH_TERMS_RE, EXTRA_ENTITY_PATTERNS } from "./phren-core.js";
+import { isInactiveFindingLine } from "./finding-lifecycle.js";
+// ── LLM provider abstraction ────────────────────────────────────────────────
+const MAX_CACHE_ENTRIES = 500;
+function loadCache(cachePath) {
+    if (!fs.existsSync(cachePath))
+        return {};
+    const raw = JSON.parse(fs.readFileSync(cachePath, "utf8"));
+    const now = Date.now();
+    const normalized = {};
+    for (const [key, entry] of Object.entries(raw)) {
+        const ts = typeof entry.ts === "number" ? entry.ts : now;
+        normalized[key] = { result: entry.result, ts };
+    }
+    return normalized;
+}
+function trimCache(cache) {
+    const entries = Object.entries(cache);
+    if (entries.length <= MAX_CACHE_ENTRIES)
+        return;
+    entries
+        .sort(([, a], [, b]) => a.ts - b.ts)
+        .slice(0, entries.length - MAX_CACHE_ENTRIES)
+        .forEach(([key]) => {
+        delete cache[key];
+    });
+}
+function persistCache(cachePath, cache) {
+    trimCache(cache);
+    fs.writeFileSync(cachePath, JSON.stringify(cache));
+}
+/**
+ * Generic cache-through helper: load cache → check TTL → touch timestamp → persist → return.
+ * If the key is cached and within TTL, returns the cached result.
+ * Otherwise, calls `compute()` to produce a fresh result, caches it, and returns it.
+ */
+async function withCache(cachePath, key, ttlMs, compute) {
+    // Check cache
+    try {
+        const cache = loadCache(cachePath);
+        if (cache[key] && Date.now() - cache[key].ts < ttlMs) {
+            cache[key].ts = Date.now();
+            persistCache(cachePath, cache);
+            return cache[key].result;
+        }
+    }
+    catch (err) {
+        if ((process.env.PHREN_DEBUG || process.env.PHREN_DEBUG))
+            process.stderr.write(`[phren] withCache load (${path.basename(cachePath)}): ${err instanceof Error ? err.message : String(err)}\n`);
+    }
+    const result = await compute();
+    // Persist result
+    try {
+        const cache = loadCache(cachePath);
+        cache[key] = { result, ts: Date.now() };
+        persistCache(cachePath, cache);
+    }
+    catch (err) {
+        if ((process.env.PHREN_DEBUG || process.env.PHREN_DEBUG))
+            process.stderr.write(`[phren] withCache persist (${path.basename(cachePath)}): ${err instanceof Error ? err.message : String(err)}\n`);
+    }
+    return result;
+}
+function isAbortError(error) {
+    return error instanceof Error && error.name === "AbortError";
+}
+const LLM_TIMEOUT_MS = 10_000;
+function parseOpenAiResponse(data) {
+    const d = data;
+    return d.choices?.[0]?.message?.content?.trim() ?? "";
+}
+/** POST to an LLM endpoint with a combined per-call timeout + parent abort relay. */
+async function fetchLlm(url, init, signal, parseResponse) {
+    const controller = new AbortController();
+    const timeoutId = setTimeout(() => controller.abort(), LLM_TIMEOUT_MS);
+    if (signal)
+        signal.addEventListener("abort", () => controller.abort(), { once: true });
+    let response;
+    try {
+        response = await fetch(url, { ...init, signal: controller.signal });
+    }
+    finally {
+        clearTimeout(timeoutId);
+    }
+    if (!response.ok)
+        throw new Error(`LLM API error: ${response.status}`);
+    return parseResponse(await response.json());
+}
+// Default maxTokens is 10 — callers that only need YES/NO or CONFLICT/OK responses
+// need just 3-5 tokens. Callers expecting longer output pass an explicit override (e.g. 60).
+export async function callLlm(prompt, signal, maxTokens = 10) {
+    // Check abort before starting any work to avoid unnecessary API calls
+    if (signal?.aborted)
+        throw new DOMException("Aborted", "AbortError");
+    const endpoint = (process.env.PHREN_LLM_ENDPOINT);
+    const customKey = (process.env.PHREN_LLM_KEY);
+    const anthropicKey = process.env.ANTHROPIC_API_KEY;
+    const openaiKey = process.env.OPENAI_API_KEY;
+    const model = (process.env.PHREN_LLM_MODEL);
+    if (endpoint) {
+        // Custom endpoint: use PHREN_LLM_KEY, fall back to any available key
+        const key = customKey || openaiKey || anthropicKey || "";
+        return fetchLlm(`${endpoint.replace(/\/$/, "")}/chat/completions`, {
+            method: "POST",
+            headers: { "Content-Type": "application/json", ...(key ? { Authorization: `Bearer ${key}` } : {}) },
+            body: JSON.stringify({ model: model || "gpt-4o-mini", messages: [{ role: "user", content: prompt }], max_tokens: maxTokens, temperature: 0 }),
+        }, signal, parseOpenAiResponse);
+    }
+    else if (anthropicKey) {
+        // Anthropic REST API fallback (no SDK required)
+        return fetchLlm("https://api.anthropic.com/v1/messages", {
+            method: "POST",
+            headers: { "content-type": "application/json", "x-api-key": anthropicKey, "anthropic-version": "2023-06-01" },
+            body: JSON.stringify({ model: model || "claude-haiku-4-5-20251001", max_tokens: maxTokens, messages: [{ role: "user", content: prompt }] }),
+        }, signal, (data) => {
+            const d = data;
+            const block = d.content?.[0];
+            return (block?.type === "text" ? block.text ?? "" : "").trim();
+        });
+    }
+    else if (openaiKey) {
+        // OpenAI REST API fallback
+        return fetchLlm("https://api.openai.com/v1/chat/completions", {
+            method: "POST",
+            headers: { "Content-Type": "application/json", Authorization: `Bearer ${openaiKey}` },
+            body: JSON.stringify({ model: model || "gpt-4o-mini", messages: [{ role: "user", content: prompt }], max_tokens: maxTokens, temperature: 0 }),
+        }, signal, parseOpenAiResponse);
+    }
+    else {
+        // No LLM configured — return empty to signal "not duplicate" / "no conflict"
+        return "";
+    }
+}
+// ── Cache TTL constants ───────────────────────────────────────────────────────
+const DEDUP_CACHE_TTL_MS = 86_400_000; // 1 day
+const CONFLICT_CACHE_TTL_MS = 7 * 86_400_000; // 7 days
+// ── Metadata stripping helpers ────────────────────────────────────────────────
+/**
+ * Strip HTML comments only (timestamp metadata, citations).
+ * Use this when you only need to remove <!-- ... --> markers.
+ */
+function stripHtmlComments(s) {
+    return s.replace(/<!--.*?-->/gs, "");
+}
+/**
+ * Strip all common finding metadata:
+ * - HTML comments: <!-- ... -->
+ * - "migrated from" annotations: (migrated from ...)
+ * - Leading bullet dash: "- " at the start of the string
+ */
+export function stripMetadata(s) {
+    return s
+        .replace(/<!--.*?-->/gs, "")
+        .replace(/\(migrated from [^)]+\)/gi, "")
+        .replace(/^-\s+/, "");
+}
+// Stop words for lightweight semantic overlap checks
+const DEDUP_STOP_WORDS = new Set([
+    "the", "a", "an", "is", "are", "was", "were", "in", "on", "at", "to", "for",
+    "of", "and", "or", "but", "not", "with", "from", "by", "as", "it", "its",
+    "this", "that", "be", "has", "have", "had", "will", "would", "can", "could", "should",
+]);
+export function jaccardTokenize(text) {
+    return new Set(text.toLowerCase()
+        .split(/[\s\W]+/)
+        .filter(w => w.length > 0 && !DEDUP_STOP_WORDS.has(w)));
+}
+export function jaccardSimilarity(a, b) {
+    if (a.size === 0 && b.size === 0)
+        return 1;
+    let intersection = 0;
+    for (const w of a) {
+        if (b.has(w))
+            intersection++;
+    }
+    const union = a.size + b.size - intersection;
+    return union === 0 ? 0 : intersection / union;
+}
+// ── Contradiction detection ───────────────────────────────────────────────────
+// Use the shared universal starter set. Framework/tool specifics are learned
+// dynamically per project via extractDynamicEntities().
+const PROSE_ENTITY_RE = UNIVERSAL_TECH_TERMS_RE;
+const POSITIVE_RE = /\b(always|prefer|should|must|works|recommend|enable)\b/i;
+const NEGATIVE_RE = /\b(never|avoid|don't|do not|shouldn't|must not|broken|deprecated|disable)\b/i;
+// ── Dynamic entity extraction ─────────────────────────────────────────────────
+const ENTITY_CACHE_TTL_MS = 60 * 60 * 1000; // 1 hour
+// Patterns that suggest a token is a proper noun / tool name:
+//   - CamelCase word (at least one interior uppercase): PhotonMappingEngine, GameKit
+//   - All-caps acronym of 2–8 letters: AWS, GPU, API
+//   - Known suffix patterns: *.js, *Engine, *API, *SDK, *DB, *UI, *ML
+const DYNAMIC_ENTITY_RE = /\b(?:[A-Z][a-z]+(?:[A-Z][a-z]*)+|[A-Z]{2,8}|[A-Z][a-z]+(?:Engine|API|SDK|DB|UI|ML|IO|OS|JS|TS|CLI|MCP|GL|VR|AR|AI|NN|GAN))\b/g;
+/**
+ * Scan existing findings for proper nouns / tool names that appear in 2+ bullets.
+ * Results are cached in .runtime/project-entities-{project}.json (1h TTL or
+ * invalidated when FINDINGS.md changes).
+ */
+export function extractDynamicEntities(phrenPath, project) {
+    try {
+        const findingsPath = path.join(phrenPath, project, "FINDINGS.md");
+        if (!fs.existsSync(findingsPath))
+            return new Set();
+        const findingsStat = fs.statSync(findingsPath);
+        const findingsMtime = findingsStat.mtimeMs;
+        const cachePath = runtimeFile(phrenPath, `project-entities-${project}.json`);
+        // Try reading existing cache
+        if (fs.existsSync(cachePath)) {
+            try {
+                const cached = JSON.parse(fs.readFileSync(cachePath, "utf8"));
+                const age = Date.now() - (cached.builtAt ?? 0);
+                if (age < ENTITY_CACHE_TTL_MS && cached.findingsMtimeMs === findingsMtime) {
+                    return new Set(cached.entities);
+                }
+            }
+            catch {
+                // fall through to rebuild
+            }
+        }
+        // Rebuild: scan bullets for candidate tokens
+        const content = fs.readFileSync(findingsPath, "utf8");
+        const bullets = content.split("\n").filter(l => l.startsWith("- ") && !isInactiveFindingLine(l));
+        // Count occurrences of each candidate across bullets
+        const counts = new Map();
+        for (const bullet of bullets) {
+            const stripped = bullet.replace(/<!--.*?-->/g, "").replace(/^-\s+/, "");
+            const seen = new Set();
+            let m;
+            const re = new RegExp(DYNAMIC_ENTITY_RE.source, DYNAMIC_ENTITY_RE.flags);
+            while ((m = re.exec(stripped)) !== null) {
+                const token = m[0];
+                if (!seen.has(token)) {
+                    seen.add(token);
+                    counts.set(token, (counts.get(token) ?? 0) + 1);
+                }
+            }
+        }
+        // Keep tokens that appear in 2+ distinct bullets
+        const entities = [...counts.entries()]
+            .filter(([, n]) => n >= 2)
+            .map(([token]) => token.toLowerCase());
+        // Write cache
+        const cacheEntry = { entities, builtAt: Date.now(), findingsMtimeMs: findingsMtime };
+        fs.writeFileSync(cachePath, JSON.stringify(cacheEntry));
+        return new Set(entities);
+    }
+    catch {
+        return new Set();
+    }
+}
+function extractProseEntities(text, dynamicEntities) {
+    const found = new Set();
+    const re = new RegExp(PROSE_ENTITY_RE.source, PROSE_ENTITY_RE.flags);
+    let m;
+    while ((m = re.exec(text)) !== null)
+        found.add(m[0].toLowerCase());
+    // Match additional entity patterns (versions, env keys, file paths, error codes, dates)
+    for (const { re: pattern } of EXTRA_ENTITY_PATTERNS) {
+        const pRe = new RegExp(pattern.source, pattern.flags);
+        let pm;
+        while ((pm = pRe.exec(text)) !== null)
+            found.add(pm[0].toLowerCase());
+    }
+    if (dynamicEntities) {
+        // Also check whether any dynamic entity appears (case-insensitive word match)
+        for (const entity of dynamicEntities) {
+            const escaped = entity.replace(/[.*+?^${}()|[\]\\]/g, "\\$&");
+            if (new RegExp(`\\b${escaped}\\b`, "i").test(text)) {
+                found.add(entity);
+            }
+        }
+    }
+    return [...found];
+}
+function learningPolarity(text) {
+    const hasPos = POSITIVE_RE.test(text);
+    const hasNeg = NEGATIVE_RE.test(text);
+    if (hasPos && !hasNeg)
+        return "positive";
+    if (hasNeg && !hasPos)
+        return "negative";
+    return "neutral";
+}
+/** Returns existing learning lines that appear to conflict with newFinding. */
+export function detectConflicts(newFinding, existingLines, dynamicEntities) {
+    const newEntities = extractProseEntities(newFinding, dynamicEntities);
+    if (newEntities.length === 0)
+        return [];
+    const newPol = learningPolarity(newFinding);
+    if (newPol === "neutral")
+        return [];
+    const conflicts = [];
+    for (const line of existingLines) {
+        if (!line.startsWith("- "))
+            continue;
+        const lineEntities = extractProseEntities(line, dynamicEntities);
+        const shared = lineEntities.filter((e) => newEntities.includes(e));
+        if (shared.length === 0)
+            continue;
+        const linePol = learningPolarity(line);
+        if (linePol !== "neutral" && linePol !== newPol) {
+            conflicts.push(line);
+        }
+    }
+    return conflicts;
+}
+export function isDuplicateFinding(existingContent, newLearning, threshold = 0.6) {
+    const normalize = (text) => {
+        return stripHtmlComments(text).trim()
+            .toLowerCase()
+            .replace(/[^a-z0-9\s]/g, " ")
+            .split(/\s+/)
+            .filter(w => w.length > 2 && !DEDUP_STOP_WORDS.has(w));
+    };
+    const newWords = normalize(newLearning);
+    if (newWords.length === 0)
+        return false;
+    const newSet = new Set(newWords);
+    const bullets = existingContent.split("\n").filter(l => l.startsWith("- "));
+    for (const bullet of bullets) {
+        if (isInactiveFindingLine(bullet))
+            continue;
+        const existingWords = normalize(bullet);
+        if (existingWords.length === 0)
+            continue;
+        const existingSet = new Set(existingWords);
+        // Fast path: exact word overlap check
+        let overlap = 0;
+        for (const w of newSet) {
+            if (existingSet.has(w))
+                overlap++;
+        }
+        const smaller = Math.min(newSet.size, existingSet.size);
+        if (smaller > 0 && overlap / smaller > threshold) {
+            debugLog(`duplicate-detection: skipping learning, ${Math.round((overlap / smaller) * 100)}% overlap with existing: "${bullet.slice(0, 80)}"`);
+            return true;
+        }
+        // Second pass: Jaccard similarity (strip metadata before comparing)
+        const newTokens = jaccardTokenize(stripMetadata(newLearning));
+        const existingTokens = jaccardTokenize(stripMetadata(bullet));
+        if (newTokens.size < 3 || existingTokens.size < 3)
+            continue; // too few tokens for reliable Jaccard
+        const jaccard = jaccardSimilarity(newTokens, existingTokens);
+        if (jaccard > 0.55) {
+            debugLog(`duplicate-detection: Jaccard ${Math.round(jaccard * 100)}% with existing: "${bullet.slice(0, 80)}"`);
+            return true;
+        }
+    }
+    return false;
+}
+// ── Typed observation tags ────────────────────────────────────────────────────
+/**
+ * Normalize known observation tags in learning text to lowercase.
+ * Returns the normalized text and a warning if unknown bracket tags are found.
+ */
+export function normalizeObservationTags(text) {
+    // Normalize known tags to lowercase
+    let normalized = text.replace(/\[([a-zA-Z_-]+)\]/g, (_match, tag) => {
+        const lower = tag.toLowerCase();
+        if (KNOWN_OBSERVATION_TAGS.has(lower))
+            return `[${lower}]`;
+        return _match; // keep unknown tags as-is
+    });
+    // Detect unknown bracket tags for warning
+    const unknownTags = [];
+    const tagPattern = /\[([a-zA-Z_-]+)\]/g;
+    let m;
+    while ((m = tagPattern.exec(normalized)) !== null) {
+        const lower = m[1].toLowerCase();
+        if (!KNOWN_OBSERVATION_TAGS.has(lower)) {
+            unknownTags.push(m[0]);
+        }
+    }
+    const warning = unknownTags.length > 0
+        ? `Unknown tag(s) ${unknownTags.join(", ")} — known tags: ${[...KNOWN_OBSERVATION_TAGS].map(t => `[${t}]`).join(", ")}`
+        : undefined;
+    return { text: normalized, warning };
+}
+/**
+ * Scan text for secrets and PII patterns. Returns the type of secret found, or null if clean.
+ */
+export function scanForSecrets(text) {
+    // AWS Access Key
+    if (/AKIA[0-9A-Z]{16}/.test(text))
+        return 'AWS access key';
+    // AWS Secret Access Key (variable assignment pattern)
+    if (/(?:aws[_-]?secret|AWS_SECRET)[_-]?(?:access[_-]?)?key[_-]?(?:id)?['":\s]+[A-Za-z0-9/+=]{40}/i.test(text))
+        return 'AWS secret access key';
+    // JWT token
+    if (/eyJ[A-Za-z0-9_-]+\.[A-Za-z0-9_-]+\.[A-Za-z0-9_-]+/.test(text))
+        return 'JWT token';
+    // Long base64-encoded secret-like blob (requires base64 chars including +/= and must not be
+    // a plain hex digest like a git commit SHA — 40-char lowercase hex is explicitly exempt).
+    if (!/^[0-9a-f]{40}$/.test(text) && /(?=[A-Za-z0-9+/]*[+/][A-Za-z0-9+/]*)[A-Za-z0-9+/]{40,}={0,2}/.test(text.replace(/[0-9a-f]{40}/g, "")))
+        return 'long base64 secret';
+    // Connection string with credentials
+    if (/(mongodb|postgres|mysql|redis):\/\/[^@\s]+:[^@\s]+@/i.test(text))
+        return 'connection string with credentials';
+    // SSH private key
+    if (/-----BEGIN (RSA|EC|OPENSSH) PRIVATE KEY-----/.test(text))
+        return 'SSH private key';
+    // Anthropic API key
+    if (/sk-ant-api\d{2}-[A-Za-z0-9_\-]{10,}/.test(text))
+        return 'Anthropic API key';
+    // OpenAI API key
+    if (/sk-proj-[A-Za-z0-9_\-]{30,}/.test(text))
+        return 'OpenAI API key';
+    // GitHub PAT classic
+    if (/ghp_[A-Za-z0-9]{36}/.test(text))
+        return 'GitHub personal access token';
+    // GitHub OAuth token
+    if (/gho_[A-Za-z0-9]{36}/.test(text))
+        return 'GitHub OAuth token';
+    // GitHub tokens (classic, OAuth, user, org, server)
+    if (/gh[pousr]_[A-Za-z0-9]{36}/.test(text))
+        return 'GitHub token';
+    // Slack bot token
+    if (/xoxb-[0-9]+-[A-Za-z0-9-]+/.test(text))
+        return 'Slack bot token';
+    // Slack user token
+    if (/xoxp-[0-9]+-[A-Za-z0-9-]+/.test(text))
+        return 'Slack user token';
+    // Stripe secret key
+    if (/sk_live_[A-Za-z0-9]{24,}/.test(text))
+        return 'Stripe secret key';
+    // Stripe publishable key
+    if (/pk_live_[A-Za-z0-9]{24,}/.test(text))
+        return 'Stripe publishable key';
+    // npm access token
+    if (/npm_[A-Za-z0-9]{36}/.test(text))
+        return 'npm access token';
+    // GCP service account
+    if (/"private_key_id"\s*:\s*"[^"]{20,}"/.test(text))
+        return 'GCP service account key';
+    // Generic API key (only when variable name suggests it)
+    if (/['"]?(api_?key|secret|token|password)['"]?\s*[=:]\s*['"]?[a-zA-Z0-9_\-\.]{20,}/i.test(text))
+        return 'API key or secret';
+    return null;
+}
+/**
+ * Resolve coreferences in learning text by replacing vague pronouns with concrete names.
+ */
+export function resolveCoref(text, context) {
+    if (!context.project && !context.file)
+        return text;
+    let result = text;
+    if (context.project) {
+        // Sentence-starting "It ", "This ", "That " followed by a verb-like word
+        result = result.replace(/^(It|This|That)\s+(?=[a-z])/i, (match) => `[${context.project}] ${match}`);
+        // " the project" -> " {project}"
+        result = result.replace(/\bthe project\b/gi, context.project);
+    }
+    if (context.file) {
+        const basename = path.basename(context.file);
+        result = result.replace(/\b(this file|the file)\b/gi, basename);
+    }
+    // If text has no concrete nouns AND has vague pronouns, prepend context
+    if (context.project && /\b(it|this|that|they|them)\b/i.test(result)) {
+        const hasConcreteNoun = /[A-Z][a-z]+[A-Z]|[a-z]+\.[a-z]+|@[a-z]|https?:\/\//.test(result);
+        if (!hasConcreteNoun && result === text) {
+            result = `[context: ${context.project}] ${result}`;
+        }
+    }
+    return result;
+}
+/**
+ * LLM-based semantic dedup check. Only called when PHREN_FEATURE_SEMANTIC_DEDUP=1.
+ * Must be called before addFindingToFile() since that function is sync.
+ * Returns true if the new learning is a semantic duplicate of any existing bullet.
+ */
+export async function checkSemanticDedup(phrenPath, project, newLearning, signal) {
+    if (!isFeatureEnabled("PHREN_FEATURE_SEMANTIC_DEDUP", false))
+        return false;
+    const resolvedDir = safeProjectPath(phrenPath, project);
+    if (!resolvedDir)
+        return false;
+    const findingsPath = path.join(resolvedDir, "FINDINGS.md");
+    if (!fs.existsSync(findingsPath))
+        return false;
+    const existingContent = fs.readFileSync(findingsPath, "utf8");
+    const bullets = existingContent.split("\n").filter((l) => l.startsWith("- ") && !isInactiveFindingLine(l));
+    for (const bullet of bullets) {
+        const a = stripMetadata(newLearning).trim();
+        const b = stripMetadata(bullet).trim();
+        const tokA = jaccardTokenize(a);
+        const tokB = jaccardTokenize(b);
+        if (tokA.size < 3 || tokB.size < 3)
+            continue;
+        const jaccard = jaccardSimilarity(tokA, tokB);
+        if (jaccard >= 0.55)
+            continue; // already caught by sync isDuplicateFinding
+        if (jaccard >= 0.3) {
+            const isDup = await semanticDedup(a, b, phrenPath, signal);
+            if (isDup)
+                return true;
+        }
+    }
+    return false;
+}
+async function semanticDedup(a, b, phrenPath, signal) {
+    const key = crypto.createHash("sha256").update(a + "|||" + b).digest("hex");
+    const cachePath = runtimeFile(phrenPath, "dedup-cache.json");
+    try {
+        return await withCache(cachePath, key, DEDUP_CACHE_TTL_MS, async () => {
+            const answer = await callLlm(`Are these two findings semantically equivalent? Reply YES or NO only.\nA: ${a}\nB: ${b}`, signal);
+            return answer.trim().toUpperCase().startsWith("YES");
+        });
+    }
+    catch (error) {
+        if (isAbortError(error))
+            return false;
+        return false; // fallback: not a duplicate
+    }
+}
+const CONFLICT_CHECK_TOTAL_TIMEOUT_MS = 30_000;
+/**
+ * LLM-based conflict check. Only called when PHREN_FEATURE_SEMANTIC_CONFLICT=1.
+ * Call after detectConflicts() in addFindingToFile flow.
+ * Returns conflict annotations to append to the bullet.
+ * Also scans global findings and other projects for cross-project contradictions.
+ * Has a 30-second total timeout; returns partial results if the deadline is hit.
+ */
+export async function checkSemanticConflicts(phrenPath, project, newFinding, signal) {
+    if (!isFeatureEnabled("PHREN_FEATURE_SEMANTIC_CONFLICT", false))
+        return { annotations: [], checked: false };
+    const resolvedDir = safeProjectPath(phrenPath, project);
+    if (!resolvedDir)
+        return { annotations: [], checked: false };
+    const newEntities = extractProseEntities(newFinding);
+    if (newEntities.length === 0)
+        return { annotations: [], checked: true };
+    // Collect bullet sources: { bullets, sourceProject } pairs
+    const sources = [];
+    // Current project
+    const findingsPath = path.join(resolvedDir, "FINDINGS.md");
+    if (fs.existsSync(findingsPath)) {
+        const content = fs.readFileSync(findingsPath, "utf8");
+        sources.push({ bullets: content.split("\n").filter((l) => l.startsWith("- ")), sourceProject: null });
+    }
+    // Global project findings
+    const globalFindingsPath = path.join(phrenPath, "global", "FINDINGS.md");
+    if (fs.existsSync(globalFindingsPath)) {
+        const content = fs.readFileSync(globalFindingsPath, "utf8");
+        const bullets = content.split("\n").filter((l) => l.startsWith("- "));
+        if (bullets.length > 0)
+            sources.push({ bullets, sourceProject: "global" });
+    }
+    // Scan other projects by FINDINGS.md recency so we still check the hottest projects first,
+    // but do not truncate the search set and miss older contradictions.
+    try {
+        const entries = fs.readdirSync(phrenPath, { withFileTypes: true });
+        const otherProjects = entries
+            .filter((e) => e.isDirectory() && e.name !== project && e.name !== "global" && !e.name.startsWith("."))
+            .map((e) => {
+            const fp = path.join(phrenPath, e.name, "FINDINGS.md");
+            if (!fs.existsSync(fp))
+                return null;
+            try {
+                return { name: e.name, mtime: fs.statSync(fp).mtimeMs, fp };
+            }
+            catch (err) {
+                if ((process.env.PHREN_DEBUG || process.env.PHREN_DEBUG))
+                    process.stderr.write(`[phren] crossProjectScan stat: ${err instanceof Error ? err.message : String(err)}\n`);
+                return null;
+            }
+        })
+            .filter((x) => x !== null)
+            .sort((a, b) => b.mtime - a.mtime);
+        for (const proj of otherProjects) {
+            const content = fs.readFileSync(proj.fp, "utf8");
+            const bullets = content.split("\n").filter((l) => l.startsWith("- "));
+            if (bullets.length > 0)
+                sources.push({ bullets, sourceProject: proj.name });
+        }
+    }
+    catch (err) {
+        if ((process.env.PHREN_DEBUG || process.env.PHREN_DEBUG))
+            process.stderr.write(`[phren] crossProjectScan: ${err instanceof Error ? err.message : String(err)}\n`);
+    }
+    const annotations = [];
+    const deadline = Date.now() + CONFLICT_CHECK_TOTAL_TIMEOUT_MS;
+    outer: for (const { bullets, sourceProject } of sources) {
+        for (const line of bullets) {
+            // Respect the aggregate deadline — return partial results rather than hanging
+            if (Date.now() >= deadline) {
+                debugLog("checkSemanticConflicts: total timeout reached, returning partial results");
+                break outer;
+            }
+            const lineEntities = extractProseEntities(line);
+            const shared = lineEntities.filter((e) => newEntities.includes(e));
+            if (shared.length === 0)
+                continue;
+            const result = await llmConflictCheck(line, newFinding, shared[0], phrenPath, signal);
+            if (result === "CONFLICT") {
+                const snippet = stripMetadata(line).trim().slice(0, 80);
+                const sourceLabel = sourceProject ? ` (from project: ${sourceProject})` : "";
+                annotations.push(`<!-- conflicts_with: "${snippet}"${sourceLabel} -->`);
+            }
+        }
+    }
+    return { annotations, checked: true };
+}
+async function llmConflictCheck(existing, newFinding, entity, phrenPath, signal) {
+    const key = crypto.createHash("sha256").update(existing + "|||" + newFinding).digest("hex");
+    const cachePath = runtimeFile(phrenPath, "conflict-cache.json");
+    try {
+        return await withCache(cachePath, key, CONFLICT_CACHE_TTL_MS, async () => {
+            const answer = await callLlm(`Finding A: ${existing}. Finding B: ${newFinding}. Do these contradict each other about how to use ${entity}? Reply CONFLICT or OK only.`, signal);
+            return answer.trim().toUpperCase().startsWith("CONFLICT")
+                ? "CONFLICT"
+                : "OK";
+        });
+    }
+    catch (error) {
+        if (isAbortError(error))
+            return "OK";
+        return "OK";
+    }
+}